davi's picture

1 2

davi

davi412

·

AI & ML interests

None yet

Organizations

upvoted a paper 2 months ago

SRPO: A Cross-Domain Implementation of Large-Scale Reinforcement Learning on LLM

Paper • 2504.14286 • Published Apr 19 • 2