Jiacai Liu's picture

6

Jiacai Liu

skydownacai

·

AI & ML interests

Reinforcement Learning

Organizations

upvoted 2 papers 3 months ago

Harnessing Uncertainty: Entropy-Modulated Policy Gradients for Long-Horizon LLM Agents

Paper • 2509.09265 • Published Sep 11 • 46

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

Paper • 2509.02479 • Published Sep 2 • 83

upvoted a paper 4 months ago

WideSearch: Benchmarking Agentic Broad Info-Seeking

Paper • 2508.07999 • Published Aug 11 • 110

upvoted a collection 6 months ago

Skywork-OR1

Skywork Open Reasoner 1 • 11 items • Updated May 29 • 31

upvoted 2 papers 6 months ago

Skywork Open Reasoner 1 Technical Report

Paper • 2505.22312 • Published May 28 • 54

Skywork-Reward: Bag of Tricks for Reward Modeling in LLMs

Paper • 2410.18451 • Published Oct 24, 2024 • 20