mradermacher
/

gpt2-rlhf-anthropic-GGUF

reinforcement-learning-from-human-feedback

anthropic-hh-rlhf

chatgpt-style-training

supervised-fine-tuning

human-preferences

Model card Files Files and versions

gpt2-rlhf-anthropic-GGUF

Commit History

auto-patch README.md

837eaa8
verified

mradermacher commited on Sep 22

auto-patch README.md

1a40b9e
verified

mradermacher commited on Sep 22

uploaded from leia

c5dd94b
verified

mradermacher commited on Sep 22

uploaded from leia

550efac
verified

mradermacher commited on Sep 22

initial commit

77c6a47
verified

mradermacher commited on Sep 22