Chao Du

duchao

https://duchao0726.github.io/

AI & ML interests

Generative Modeling & Trustworthy ML

Recent Activity

upvoted a paper 3 days ago

Diffusion Language Models are Super Data Learners

upvoted a paper about 1 month ago

Variational Reasoning for Language Models

upvoted a paper about 1 month ago

Language Models Can Learn from Verbal Feedback Without Scalar Rewards

View all activity

Organizations

None yet

upvoted a paper 3 days ago

Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published 4 days ago • 92

upvoted 2 papers about 1 month ago

Variational Reasoning for Language Models

Paper • 2509.22637 • Published Sep 26 • 68

Language Models Can Learn from Verbal Feedback Without Scalar Rewards

Paper • 2509.22638 • Published Sep 26 • 67

upvoted a paper 2 months ago

VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use

Paper • 2509.01055 • Published Sep 1 • 73

upvoted 2 papers 5 months ago

Reinforcing General Reasoning without Verifiers

Paper • 2505.21493 • Published May 27 • 26

Fostering Video Reasoning via Next-Event Prediction

Paper • 2505.22457 • Published May 28 • 29

authored a paper 6 months ago

Optimizing Anytime Reasoning via Budget Relative Policy Optimization

Paper • 2505.13438 • Published May 19 • 36

upvoted a paper 6 months ago

Optimizing Anytime Reasoning via Budget Relative Policy Optimization

Paper • 2505.13438 • Published May 19 • 36

authored 2 papers 7 months ago

UFO2: The Desktop AgentOS

Paper • 2504.14603 • Published Apr 20 • 29

Understanding R1-Zero-Like Training: A Critical Perspective

Paper • 2503.20783 • Published Mar 26 • 56

authored a paper 8 months ago

Error Analyses of Auto-Regressive Video Diffusion Models: A Unified Framework

Paper • 2503.10704 • Published Mar 12 • 5

authored 3 papers 12 months ago

upvoted a paper about 1 year ago

Sample-Efficient Alignment for LLMs

Paper • 2411.01493 • Published Nov 3, 2024 • 12

authored 5 papers over 1 year ago

Efficient Diffusion Policies for Offline Reinforcement Learning

Paper • 2305.20081 • Published May 31, 2023 • 2

Does Federated Learning Really Need Backpropagation?

Paper • 2301.12195 • Published Jan 28, 2023

On Calibrating Diffusion Probabilistic Models

Paper • 2302.10688 • Published Feb 21, 2023 • 1

A Recipe for Watermarking Diffusion Models

Paper • 2303.10137 • Published Mar 17, 2023

Bag of Tricks for Training Data Extraction from Language Models

Paper • 2302.04460 • Published Feb 9, 2023 • 2

Chao Du

AI & ML interests

Recent Activity

Organizations

duchao's activity