Reward Models - a CKeibel Collection

CKeibel 's Collections

SLMs

PII

Code-Embeddings

Speech2Text (ASR)

Seq2Seq

diffusion models

Text-Classification

Data

Causal LMs, seq2seq models

Embedding models

NER

BERT based tasks (models)

Reward Models

updated Dec 18, 2024

RLHFlow/Llama3.1-8B-PRM-Deepseek-Data

Text Generation • 8B • Updated May 10 • 1.63k • • 37