Spaces:

yhavinga
/

dutch-tokenizer-arena

Running

App Files Files Community

xu-song commited on Mar 8, 2024

Commit

5db13e0

·

1 Parent(s): f0f84b2

add amber and crystal_coder

Files changed (3) hide show

vocab/__init__.py +2 -1
vocab/amber/__init__.py +3 -0
vocab/crystal_coder/__init__.py +7 -0

vocab/__init__.py CHANGED Viewed

@@ -135,7 +135,8 @@ all_tokenizers = [
     ("gpt_4", "", "tiktoken"),
     # 未分类
     ("mistral_7b",),
     ("mixtral_8_7b",),

     ("gpt_4", "", "tiktoken"),
     # 未分类
+    ("amber", ""),
+    ("crystal_coder", ""),
     ("mistral_7b",),
     ("mixtral_8_7b",),

vocab/amber/__init__.py ADDED Viewed

	@@ -0,0 +1,3 @@


1	+ from transformers import LlamaTokenizer
2	+
3	+ tokenizer = LlamaTokenizer.from_pretrained("LLM360/Amber", revision="ckpt_356")

vocab/crystal_coder/__init__.py ADDED Viewed

	@@ -0,0 +1,7 @@

+from transformers import AutoTokenizer
+tokenizer = AutoTokenizer.from_pretrained(
+    "LLM360/CrystalCoder",
+    revision="CrystalCoder_phase1_checkpoint_055500",
+    trust_remote_code=True
+)