RL - Reinforcement Learning - a ljupco Collection

ljupco 's Collections

RL - Reinforcement Learning

agents

context, prompt

speed efficiency gains

RL - Reinforcement Learning

updated 20 days ago

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

Paper • 2510.11696 • Published 26 days ago • 173
Demystifying Reinforcement Learning in Agentic Reasoning

Paper • 2510.11701 • Published 26 days ago • 31