daxiongshu
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GRPO-test / runs

Commit History

Training in progress, step 113

f62cd36
verified

daxiongshu commited on May 20

Training in progress, step 110

93c590a
verified

daxiongshu commited on May 20

Training in progress, step 100

d541ae8
verified

daxiongshu commited on May 20

Training in progress, step 90

68ed266
verified

daxiongshu commited on May 20

Training in progress, step 80

e3e609f
verified

daxiongshu commited on May 20

Training in progress, step 70

bcbae86
verified

daxiongshu commited on May 20

Training in progress, step 60

d06de87
verified

daxiongshu commited on May 20

Training in progress, step 50

355cc5b
verified

daxiongshu commited on May 20

Training in progress, step 40

e9cb201
verified

daxiongshu commited on May 20

Training in progress, step 30

9f0081f
verified

daxiongshu commited on May 20

Training in progress, step 20

52de466
verified

daxiongshu commited on May 20

Training in progress, step 10

4594bd3
verified

daxiongshu commited on May 20

Training in progress, step 10

4b5efd5
verified

daxiongshu commited on May 20