Renjie's picture

2 14 2

Renjie

RogerLos

·

AI & ML interests

LLM

Recent Activity

updated a model about 1 hour ago

RogerLos/v1-GPT5nano-critique-big_math_summary_bsz_256_one_C-plus_mis_seq_cleaned-global_step_95

published a model about 1 hour ago

RogerLos/v1-GPT5nano-critique-big_math_summary_bsz_256_one_C-plus_mis_seq_cleaned-global_step_95

updated a model about 1 hour ago

RogerLos/v1-GPT5nano-critique-big_math_summary_bsz_256_one_C-plus_mis_seq_cleaned-global_step_90

View all activity

Organizations

None yet

upvoted a paper 6 days ago

The Principles of Diffusion Models

Paper • 2510.21890 • Published 25 days ago • 56

upvoted a collection 10 days ago

Long_CoT_Degradation_SFT

Checkpoint for Long CoT Degradation • 61 items • Updated 6 days ago • 2

upvoted a paper 18 days ago

JanusCoder: Towards a Foundational Visual-Programmatic Interface for Code Intelligence

Paper • 2510.23538 • Published 21 days ago • 95

upvoted a paper 27 days ago

QueST: Incentivizing LLMs to Generate Difficult Problems

Paper • 2510.17715 • Published 28 days ago • 33

upvoted 5 papers about 1 month ago

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

Paper • 2510.11696 • Published Oct 13 • 173

Imperceptible Jailbreaking against Large Language Models

Paper • 2510.05025 • Published Oct 6 • 33

TIME: A Multi-level Benchmark for Temporal Reasoning of LLMs in Real-World Scenarios

Paper • 2505.12891 • Published May 19 • 10

MCPMark: A Benchmark for Stress-Testing Realistic and Comprehensive MCP Use

Paper • 2509.24002 • Published Sep 28 • 171

GEM: A Gym for Agentic LLMs

Paper • 2510.01051 • Published Oct 1 • 88

upvoted 2 papers about 2 months ago

OffTopicEval: When Large Language Models Enter the Wrong Chat, Almost Always!

Paper • 2509.26495 • Published Sep 30 • 10

Language Models Can Learn from Verbal Feedback Without Scalar Rewards

Paper • 2509.22638 • Published Sep 26 • 67

upvoted 2 papers 5 months ago

MiniCPM4: Ultra-Efficient LLMs on End Devices

Paper • 2506.07900 • Published Jun 9 • 92

Through the Valley: Path to Effective Long CoT Training for Small Language Models

Paper • 2506.07712 • Published Jun 9 • 18

upvoted a paper 9 months ago

Grounded Persuasive Language Generation for Automated Marketing

Paper • 2502.16810 • Published Feb 24 • 12