Yanxi Chen

yanxi-chen

AI & ML interests

None yet

Recent Activity

authored a paper about 1 month ago

On-Policy RL Meets Off-Policy Experts: Harmonizing Supervised Fine-Tuning and Reinforcement Learning via Dynamic Weighting

authored a paper about 1 month ago

Group-Relative REINFORCE Is Secretly an Off-Policy Algorithm: Demystifying Some Myths About GRPO and Its Friends

upvoted a paper about 1 month ago

Group-Relative REINFORCE Is Secretly an Off-Policy Algorithm: Demystifying Some Myths About GRPO and Its Friends

View all activity

Organizations

None yet

authored 2 papers about 1 month ago

On-Policy RL Meets Off-Policy Experts: Harmonizing Supervised Fine-Tuning and Reinforcement Learning via Dynamic Weighting

Paper • 2508.11408 • Published Aug 15 • 8

Group-Relative REINFORCE Is Secretly an Off-Policy Algorithm: Demystifying Some Myths About GRPO and Its Friends

Paper • 2509.24203 • Published Sep 29 • 7

upvoted a paper about 1 month ago

Group-Relative REINFORCE Is Secretly an Off-Policy Algorithm: Demystifying Some Myths About GRPO and Its Friends

Paper • 2509.24203 • Published Sep 29 • 7

commented a paper about 1 month ago

Group-Relative REINFORCE Is Secretly an Off-Policy Algorithm: Demystifying Some Myths About GRPO and Its Friends

Paper • 2509.24203 • Published Sep 29 • 7 •

authored 2 papers 5 months ago

Trinity-RFT: A General-Purpose and Unified Framework for Reinforcement Fine-Tuning of Large Language Models

Paper • 2505.17826 • Published May 23 • 9

Enhancing Latent Computation in Transformers with Latent Tokens

Paper • 2505.12629 • Published May 19

upvoted a paper 5 months ago

Trinity-RFT: A General-Purpose and Unified Framework for Reinforcement Fine-Tuning of Large Language Models

Paper • 2505.17826 • Published May 23 • 9

commented a paper 5 months ago

Trinity-RFT: A General-Purpose and Unified Framework for Reinforcement Fine-Tuning of Large Language Models

Paper • 2505.17826 • Published May 23 • 9 •

authored a paper 11 months ago

A Simple and Provable Scaling Law for the Test-Time Compute of Large Language Models

Paper • 2411.19477 • Published Nov 29, 2024 • 6

commented a paper 11 months ago

A Simple and Provable Scaling Law for the Test-Time Compute of Large Language Models

Paper • 2411.19477 • Published Nov 29, 2024 • 6 •

authored a paper about 1 year ago

On the Design and Analysis of LLM-Based Algorithms

Paper • 2407.14788 • Published Jul 20, 2024

authored a paper almost 2 years ago

EE-Tuning: An Economical yet Scalable Solution for Tuning Early-Exit Large Language Models

Paper • 2402.00518 • Published Feb 1, 2024 • 4

commented 3 papers almost 2 years ago

EE-LLM: Large-Scale Training and Inference of Early-Exit Large Language Models with 3D Parallelism

Paper • 2312.04916 • Published Dec 8, 2023 • 7 •

EE-LLM: Large-Scale Training and Inference of Early-Exit Large Language Models with 3D Parallelism

Paper • 2312.04916 • Published Dec 8, 2023 • 7 •

EE-LLM: Large-Scale Training and Inference of Early-Exit Large Language Models with 3D Parallelism

Paper • 2312.04916 • Published Dec 8, 2023 • 7 •

authored a paper almost 2 years ago

EE-LLM: Large-Scale Training and Inference of Early-Exit Large Language Models with 3D Parallelism

Paper • 2312.04916 • Published Dec 8, 2023 • 7

Yanxi Chen

AI & ML interests

Recent Activity

Organizations

yanxi-chen's activity