Eehan
/

Qwen2.5-1.5B-rDPO-flip-hh

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-rDPO-flip-hh

Commit History

Model save

311aa66
verified

Eehan commited on Jul 28, 2025

initial commit

eb4cebe
verified

Eehan commited on Jul 28, 2025