moonshotai
/

Kimi-VL-A3B-Instruct

Image-Text-to-Text

feature-extraction

Model card Files Files and versions

tokenizer can decode tensor for vllm test

#14

by zhouzaida - opened Apr 14

base: refs/heads/main

←

from: refs/pr/14

Discussion Files changed

Files changed (1) hide show

tokenization_moonshot.py +3 -0

tokenization_moonshot.py CHANGED Viewed

@@ -16,6 +16,7 @@ from shutil import copyfile
 from tiktoken.load import load_tiktoken_bpe
 from tokenizers import AddedToken
 from transformers.tokenization_utils import PreTrainedTokenizer
 from transformers.models.gpt2.tokenization_gpt2 import bytes_to_unicode
@@ -229,6 +230,8 @@ class TikTokenTokenizer(PreTrainedTokenizer):
         if len(kwargs) > 0:
             return super().decode(token_ids, **kwargs)
         if type(token_ids) is int:
             token_ids = [token_ids]

 from tiktoken.load import load_tiktoken_bpe
 from tokenizers import AddedToken
 from transformers.tokenization_utils import PreTrainedTokenizer
+from transformers.utils import to_py_obj
 from transformers.models.gpt2.tokenization_gpt2 import bytes_to_unicode
         if len(kwargs) > 0:
             return super().decode(token_ids, **kwargs)
+        token_ids = to_py_obj(token_ids)
         if type(token_ids) is int:
             token_ids = [token_ids]