howardzhou
/

Qwen2.5-3B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2.5-3B-Open-R1-GRPO / runs /Feb03_02-18-12_ip-172-31-29-32

51.7 kB

1 contributor

History: 5 commits

howardzhou's picture

Training in progress, step 250

d9fca68 verified 10 months ago

events.out.tfevents.1738549146.ip-172-31-29-32.2263458.0

51.7 kB
xet

Training in progress, step 250 10 months ago