grimjim
/

lemon07r_Gemma-2-Ataraxy-v4c-9B_fixed

Text Generation

text-generation-inference

Model card Files Files and versions

lemon07r/Gemma-2-Ataraxy-v4c-9B, fixed

This is a merge of pre-trained language models created using mergekit.

Excess lm_head.weight tensor weights have been trimmed away from the weights at lemon07r/Gemma-2-Ataraxy-v4c-9B.

Merge Details

Merge Method

This model was merged using the SLERP merge method.

Models Merged

The following models were included in the merge:

Configuration

The following YAML configuration was used to produce this model:

base_model: zelk12/recoilme-gemma-2-Ataraxy-9B-v0.1-t0.25
dtype: bfloat16
merge_method: slerp
parameters:
  t: 0.25
slices:
- sources:
  - layer_range: [0, 42]
    model: zelk12/recoilme-gemma-2-Ataraxy-9B-v0.1-t0.25
  - layer_range: [0, 42]
    model: lemon07r/Gemma-2-Ataraxy-v3b-9B

Open LLM Leaderboard Evaluation Results

Detailed results can be found here

Metric	Value
Avg.	32.63
IFEval (0-Shot)	69.45
BBH (3-Shot)	44.13
MATH Lvl 5 (4-Shot)	17.98
GPQA (0-shot)	11.19
MuSR (0-shot)	15.30
MMLU-PRO (5-shot)	37.72

Downloads last month: -

Safetensors

Model size

9B params

Tensor type

BF16

·

Model tree for grimjim/lemon07r_Gemma-2-Ataraxy-v4c-9B_fixed

lemon07r/Gemma-2-Ataraxy-v3b-9B

zelk12/recoilme-gemma-2-Ataraxy-9B-v0.1-t0.25

Merge model

this model

Merges

1 model

Quantizations

Collection including grimjim/lemon07r_Gemma-2-Ataraxy-v4c-9B_fixed

Mirrored mergekit-ready models

Mirrored models tweaked to be more friendly for mergekit. No pickles allowed. • 10 items • Updated 23 days ago • 1

Evaluation results

strict accuracy on IFEval (0-Shot)
Open LLM Leaderboard

69.450
normalized accuracy on BBH (3-Shot)
Open LLM Leaderboard

44.130
exact match on MATH Lvl 5 (4-Shot)
Open LLM Leaderboard

17.980
acc_norm on GPQA (0-shot)
Open LLM Leaderboard

11.190
acc_norm on MuSR (0-shot)
Open LLM Leaderboard

15.300
accuracy on MMLU-PRO (5-shot)
test set Open LLM Leaderboard

37.720

View on Papers With Code