VerIPO - a Uni-MoE Collection

Uni-MoE 's Collections

VerIPO

Uni-MoE

VerIPO

updated Jun 15

Large Multimodal Reasoning Models with Iterative Policy Refinement

Uni-MoE/VerIPO-7B-v1.0

Video-Text-to-Text • 8B • Updated Jun 6 • 3
VerIPO: Cultivating Long Reasoning in Video-LLMs via Verifier-Gudied Iterative Policy Optimization

Paper • 2505.19000 • Published May 25 • 42