DeepTron-R1Distil-7B / mergekit_config.yml
Madras1's picture
Upload do meu primeiro merge DARE/TIES Qwen 2.5 7B
48216c3 verified
raw
history blame contribute delete
428 Bytes
models:
- model: deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
# Sem parâmetros = Base sólida (Referência)
- model: nvidia/OpenMath-Nemotron-7B
parameters:
density: 0.85 # Mantenha 85% das diferenças (alta fidelidade matemática)
weight: 0.3 # Mas aplique com força BAIXA (30%)
merge_method: dare_ties
base_model: deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
parameters:
int8_mask: true
dtype: bfloat16