burtenshaw
/

Qwen2-1.5B-GRPO-overlong

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2-1.5B-GRPO-overlong

Commit History

Training in progress, step 200

00e2ee0
verified

burtenshaw HF Staff commited on Oct 3

Training in progress, step 200

5cba0d0
verified

burtenshaw HF Staff commited on Oct 3

Training in progress, step 200

53b1429
verified

burtenshaw HF Staff commited on Oct 3

Training in progress, step 200

98f2fdc
verified

burtenshaw HF Staff commited on Oct 3

initial commit

1214074
verified

burtenshaw HF Staff commited on Oct 3