KABI's picture

KABI

dongguanting

·

https://dongguanting.github.io/

AI & ML interests

Reasoning and Alignment for Large Language Models

Recent Activity

liked a model about 2 hours ago

dongguanting/QwQ-32B-AEPO-DeepSearch

upvoted a paper about 23 hours ago

ProcessBench: Identifying Process Errors in Mathematical Reasoning

upvoted a paper 6 days ago

Seed-Prover 1.5: Mastering Undergraduate-Level Theorem Proving via Learning from Experience

View all activity

Organizations

upvoted a paper about 23 hours ago

ProcessBench: Identifying Process Errors in Mathematical Reasoning

Paper • 2412.06559 • Published Dec 9, 2024 • 85

upvoted a paper 6 days ago

Seed-Prover 1.5: Mastering Undergraduate-Level Theorem Proving via Learning from Experience

Paper • 2512.17260 • Published 9 days ago • 48

upvoted 3 papers 12 days ago

Memory in the Age of AI Agents

Paper • 2512.13564 • Published 13 days ago • 113

Thinking with Images via Self-Calling Agent

Paper • 2512.08511 • Published 19 days ago • 21

Long-horizon Reasoning Agent for Olympiad-Level Mathematical Problem Solving

Paper • 2512.10739 • Published 17 days ago • 45

upvoted a paper 25 days ago

From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence

Paper • 2511.18538 • Published Nov 23 • 276

upvoted a paper 27 days ago

Latent Collaboration in Multi-Agent Systems

Paper • 2511.20639 • Published Nov 25 • 116

upvoted 2 papers about 1 month ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published Nov 24 • 60

General Agentic Memory Via Deep Research

Paper • 2511.18423 • Published Nov 23 • 161

upvoted 10 papers about 2 months ago

DeepEyesV2: Toward Agentic Multimodal Model

Paper • 2511.05271 • Published Nov 7 • 42

Scaling Agent Learning via Experience Synthesis

Paper • 2511.03773 • Published Nov 5 • 81

V-Thinker: Interactive Thinking with Images

Paper • 2511.04460 • Published Nov 6 • 96

LiveTradeBench: Seeking Real-World Alpha with Large Language Models

Paper • 2511.03628 • Published Nov 5 • 12

Video-Thinker: Sparking "Thinking with Videos" via Reinforcement Learning

Paper • 2510.23473 • Published Oct 27 • 84

LongCat-Flash-Omni Technical Report

Paper • 2511.00279 • Published Oct 31 • 22

ToolScope: An Agentic Framework for Vision-Guided and Long-Horizon Tool Use

Paper • 2510.27363 • Published Oct 31 • 22

Tongyi DeepResearch Technical Report

Paper • 2510.24701 • Published Oct 28 • 98

The Tool Decathlon: Benchmarking Language Agents for Diverse, Realistic, and Long-Horizon Task Execution

Paper • 2510.25726 • Published Oct 29 • 45

ReForm: Reflective Autoformalization with Prospective Bounded Sequence Optimization

Paper • 2510.24592 • Published Oct 28 • 16

upvoted a paper 2 months ago

ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints

Paper • 2510.14847 • Published Oct 16 • 55