convert : add necessary type: ignore comments

ggml-org · monatis · Aug 31, 2023 · Aug 30, 2023 · Aug 30, 2023 · Aug 30, 2023
commit 8a8c1cb0f2881bb5172c13c55e22ea80c72bef5a
diff --git a/convert-falcon-hf-to-gguf.py b/convert-falcon-hf-to-gguf.py
@@ -14,7 +14,7 @@
 import gguf
 import numpy as np
 import torch
-from transformers import AutoTokenizer
+from transformers import AutoTokenizer  # type: ignore[import]
 
 
 def bytes_to_unicode():

diff --git a/convert-gptneox-hf-to-gguf.py b/convert-gptneox-hf-to-gguf.py
@@ -14,7 +14,7 @@
 import gguf
 import numpy as np
 import torch
-from transformers import AutoTokenizer
+from transformers import AutoTokenizer  # type: ignore[import]
 
 # ref: https://github.com/openai/gpt-2/blob/master/src/encoder.py
 

diff --git a/convert-llama-7b-pth-to-gguf.py b/convert-llama-7b-pth-to-gguf.py
@@ -16,7 +16,7 @@
 import gguf
 import numpy as np
 import torch
-from sentencepiece import SentencePieceProcessor
+from sentencepiece import SentencePieceProcessor  # type: ignore[import]
 
 if TYPE_CHECKING:
     from typing import TypeAlias

diff --git a/convert-llama-hf-to-gguf.py b/convert-llama-hf-to-gguf.py
@@ -14,7 +14,7 @@
 import gguf
 import numpy as np
 import torch
-from sentencepiece import SentencePieceProcessor
+from sentencepiece import SentencePieceProcessor  # type: ignore[import]
 
 if TYPE_CHECKING:
     from typing import TypeAlias

diff --git a/convert.py b/convert.py
@@ -27,7 +27,7 @@
 
 import gguf
 import numpy as np
-from sentencepiece import SentencePieceProcessor  # type: ignore
+from sentencepiece import SentencePieceProcessor  # type: ignore[import]
 
 if TYPE_CHECKING:
     from typing import TypeAlias
@@ -338,7 +338,7 @@ def __init__(self, fname_tokenizer: Path, fname_added_tokens: Path | None) -> No
 
     def bpe_tokens(self) -> Iterable[tuple[bytes, float, gguf.TokenType]]:
         tokenizer = self.bpe_tokenizer
-        from transformers.models.gpt2 import tokenization_gpt2
+        from transformers.models.gpt2 import tokenization_gpt2  # type: ignore[import]
         byte_encoder = tokenization_gpt2.bytes_to_unicode()
         byte_decoder = {v: k for k, v in byte_encoder.items()}
         for i, item in enumerate(tokenizer):