Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

30

Full-text search

Active filters: prm, trl

qgallouedec/Qwen2-0.5B-Reward

Token Classification • 0.5B • Updated Sep 14, 2025 • 13

plaguss/Qwen2.5-Math-7B-PRM-0.1

Token Classification • 7B • Updated Dec 13, 2024 • 14

plaguss/Qwen2.5-Math-7B-Instruct-PRM-0.1

Token Classification • 7B • Updated Dec 13, 2024 • 8

plaguss/Qwen2.5-Math-1.5B-Instruct-PRM-0.1

Token Classification • 2B • Updated Jan 8, 2025 • 10

HuggingFaceH4/Qwen2.5-Math-1.5B-Instruct-PRM-0.2

Token Classification • 2B • Updated Jan 9, 2025 • 37

HuggingFaceH4/Qwen2.5-Math-7B-Instruct-PRM-0.2

Token Classification • 7B • Updated Jan 9, 2025 • 38

MikeMpapa/trase-prm

Token Classification • 66.4M • Updated Jan 15, 2025 • 9

MikeMpapa/TraseSystem-orm-codeblob-verifier

Token Classification • 0.5B • Updated Jan 17, 2025 • 3

smohammadi/Qwen2.5-3B-MathShepherd

Token Classification • 3B • Updated Jan 22, 2025 • 3

axolotl-ai-co/Qwen2.5-Math-PRM-7B

Token Classification • 7B • Updated Feb 18, 2025 • 10 • 1

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-V3

Token Classification • 0.5B • Updated Feb 22, 2025 • 11

alothomas/Qwen2.5-3B-PRM-RAD-balanced-V3

Token Classification • 3B • Updated Feb 22, 2025 • 6

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-V4

Token Classification • 0.5B • Updated Feb 23, 2025 • 16

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-150k

Token Classification • 0.5B • Updated Mar 3, 2025 • 111

alothomas/Qwen2.5-3B-PRM-RAD-balanced-150k

Token Classification • 3B • Updated Mar 4, 2025 • 10

hzy/Qwen2.5-Math-7B-Instruct-PRM-Modified-math_shepherd

Token Classification • 7B • Updated Mar 10, 2025 • 13

jacopo-minniti/uats-value-model

Token Classification • 2B • Updated Aug 19, 2025 • 2

jacopo-minniti/Qwen2.5-Math-7B-PUM

Token Classification • 7B • Updated Aug 26, 2025 • 4

jacopo-minniti/Qwen2.5-Math-7B-PUM-half_entropy

Token Classification • 7B • Updated Aug 30, 2025 • 3

jacopo-minniti/Qwen2.5-Math-7B-PUM-soft-classification

2B • Updated Sep 14, 2025 • 7

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-150k-LastStepOnly

Token Classification • 0.5B • Updated Sep 24, 2025 • 4

jacopo-minniti/Qwen2.5-Math-1.5B-PUM-variance

2B • Updated Sep 25, 2025 • 13

jacopo-minniti/Qwen2.5-Math-1.5B-PUM-binary-variance

Token Classification • 2B • Updated Oct 6, 2025 • 7

yungshun317/qwen2.5-0.5B-prm-mathshepherd

Token Classification • 0.5B • Updated Oct 30, 2025 • 4

jacopo-minniti/R1-Qwen-MMLU-1.5B-PUM-Variance

2B • Updated 26 days ago • 186

jacopo-minniti/R1-Qwen-MMLU-1.5B-PRM

2B • Updated 26 days ago • 49

jacopo-minniti/R1-Qwen-MMLU-1.5B-PRM-Regression

2B • Updated Nov 18, 2025 • 120

yinyil/stage2

Updated 19 days ago

ZaandaTeika/Qwen2.5-Math-7B-Instruct-SHARP-Math-PRM

Token Classification • 7B • Updated 5 days ago • 5

ZaandaTeika/Qwen2.5-Math-1.5B-Instruct-SHARP-Math-PRM

Token Classification • 2B • Updated 5 days ago • 10