Rl - a DiegoVSulz Collection

DiegoVSulz 's Collections

Rl

Rl

updated May 25

Reinforcement Learning Finetunes Small Subnetworks in Large Language Models

Paper • 2505.11711 • Published May 16 • 11