inference-optimization
/

Llama-3.3-70B-Instruct-QKV-Cache-FP8-Per-Tensor

compressed-tensors

Model card Files Files and versions

Llama-3.3-70B-Instruct-QKV-Cache-FP8-Per-Tensor

Commit History

Upload folder using huggingface_hub

88b3f98
verified

krishnateja95 commited on Dec 4, 2025

initial commit

93a4c4c
verified

krishnateja95 commited on Dec 4, 2025