HangGuo
/

QWen2.5-3B-FlatQuant-OBR-GPTQ-W4A8KV16S50

Text Generation

text-generation-inference

Model card Files Files and versions

QWen2.5-3B-FlatQuant-OBR-GPTQ-W4A8KV16S50

6.21 GB

1 contributor

History: 4 commits

HangGuo's picture

Update README.md

32a6e7d verified about 2 months ago

.gitattributes

1.52 kB

initial commit 2 months ago
README.md

9.34 kB

Update README.md about 2 months ago
added_tokens.json

605 Bytes

Upload tokenizer 2 months ago
config.json

731 Bytes

Upload Qwen2ForCausalLM 2 months ago
generation_config.json

243 Bytes

Upload Qwen2ForCausalLM 2 months ago
merges.txt

1.67 MB

Upload tokenizer 2 months ago
pytorch_model-00001-of-00002.bin
Detected Pickle imports (5)
- "torch.LongStorage",
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2",
- "torch.FloatStorage",
- "torch.BFloat16Storage"
What is a pickle import?
4.99 GB
xet

Upload Qwen2ForCausalLM 2 months ago
pytorch_model-00002-of-00002.bin
Detected Pickle imports (5)
- "torch.LongStorage",
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2",
- "torch.FloatStorage",
- "torch.BFloat16Storage"
What is a pickle import?
1.22 GB
xet

Upload Qwen2ForCausalLM 2 months ago
pytorch_model.bin.index.json

279 kB

Upload Qwen2ForCausalLM 2 months ago
special_tokens_map.json

613 Bytes

Upload tokenizer 2 months ago
tokenizer_config.json

7.31 kB

Upload tokenizer 2 months ago
vocab.json

3.38 MB

Upload tokenizer 2 months ago