Eehan
/

Qwen2.5-1.5B-drpo-lora-flip-hh

Generated from Trainer

Model card Files Files and versions

Qwen2.5-1.5B-drpo-lora-flip-hh

Commit History

Model save

fda5855
verified

Eehan commited on Jul 29

initial commit

eaff1ea
verified

Eehan commited on Jul 28