Zhiheng Xi's picture

3 8

Zhiheng Xi

WooooDyy

·

AI & ML interests

None yet

Recent Activity

commented on a paper 15 days ago

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

upvoted a paper 15 days ago

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

commented on a paper 15 days ago

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

View all activity

Organizations

upvoted a paper 15 days ago

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

Paper • 2510.24320 • Published 16 days ago • 18

upvoted a paper 21 days ago

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

Paper • 2510.18927 • Published 22 days ago • 82

upvoted a paper about 2 months ago

AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning

Paper • 2509.08755 • Published Sep 10 • 56

upvoted 2 papers 4 months ago

Skywork-R1V3 Technical Report

Paper • 2507.06167 • Published Jul 8 • 71

BMMR: A Large-Scale Bilingual Multimodal Multi-Discipline Reasoning Dataset

Paper • 2507.03483 • Published Jul 4 • 23

upvoted a paper 10 months ago

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

Paper • 2501.11425 • Published Jan 20 • 109

upvoted a paper about 1 year ago

Distill Visual Chart Reasoning Ability from LLMs to MLLMs

Paper • 2410.18798 • Published Oct 24, 2024 • 21

upvoted a paper over 1 year ago

AgentGym: Evolving Large Language Model-based Agents across Diverse Environments

Paper • 2406.04151 • Published Jun 6, 2024 • 23