XueyingJia
/

qwen-1.5b-HH-online-dpo-ground-truth-lead-xs-batch

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

qwen-1.5b-HH-online-dpo-ground-truth-lead-xs-batch / runs /Dec10_16-56-43_babel-0-31

177 kB

1 contributor

History: 32 commits

XueyingJia's picture

Training in progress, step 5398

9c51ae9 verified 11 months ago

events.out.tfevents.1733867809.babel-0-31.387621.0

177 kB
xet

Training in progress, step 5398 11 months ago