10 12 26

Zhouliang Yu

zhouliang

https://zhouliang-yu.github.io

zhouliang-yu

AI & ML interests

Model-Based AI, Reinforcement Learning, Autoformalization

Recent Activity

liked a dataset 3 days ago

ulamai/UnsolvedMath

liked a dataset 4 days ago

phanerozoic/Lean4-Mathlib

liked a dataset about 1 month ago

nvidia/Nemotron-Math-Proofs-v1

View all activity

Organizations

liked a dataset 3 days ago

ulamai/UnsolvedMath

Updated 3 days ago • 44 • 11

liked a dataset 4 days ago

phanerozoic/Lean4-Mathlib

Viewer • Updated 17 days ago • 193k • 20 • 1

liked a dataset about 1 month ago

nvidia/Nemotron-Math-Proofs-v1

Viewer • Updated 22 days ago • 925k • 983 • 101

published a dataset 2 months ago

zhouliang/DEMIMathAnalysis

Viewer • Updated Feb 27, 2025 • 88

upvoted a paper 2 months ago

P1: Mastering Physics Olympiads with Reinforcement Learning

Paper • 2511.13612 • Published Nov 17, 2025 • 134

liked a model 3 months ago

nvidia/OpenMath-Nemotron-1.5B

Text Generation • 2B • Updated Apr 30, 2025 • 2.84k • • 28

authored a paper 3 months ago

SimKO: Simple Pass@K Policy Optimization

Paper • 2510.14807 • Published Oct 16, 2025 • 11

upvoted a paper 3 months ago

SimKO: Simple Pass@K Policy Optimization

Paper • 2510.14807 • Published Oct 16, 2025 • 11

liked a dataset 3 months ago

hkust-nlp/CodeIO-PyEdu-Reasoning

Preview • Updated Jun 18, 2025 • 67 • 56

liked a model 4 months ago

nvidia/NVIDIA-Nemotron-Nano-9B-v2-Base

Text Generation • 9B • Updated Nov 4, 2025 • 56.4k • 43

upvoted a paper 4 months ago

BroRL: Scaling Reinforcement Learning via Broadened Exploration

Paper • 2510.01180 • Published Oct 1, 2025 • 19

liked a model 4 months ago

nvidia/Nemotron-H-8B-Base-8K

Text Generation • 8B • Updated Aug 21, 2025 • 12.4k • 54

upvoted a paper 5 months ago

Symbolic Graphics Programming with Large Language Models

Paper • 2509.05208 • Published Sep 5, 2025 • 47

updated a collection 5 months ago

Sphere Prover

Collection

The dataset and ckpt in Sphere-Prover-V1: Training LLM-based Prover for Formal Mathematics via Exploration-based Reinforocement Learning • 10 items • Updated Aug 21, 2025

updated a collection 6 months ago