howardzhou
/

Qwen2.5-3B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2.5-3B-Open-R1-GRPO

Commit History

Training in progress, step 250

a33b50e
verified

howardzhou commited on Feb 4

Training in progress, step 200

4c2777b
verified

howardzhou commited on Feb 4

Training in progress, step 150

ff0deef
verified

howardzhou commited on Feb 4

Training in progress, step 100

896621f
verified

howardzhou commited on Feb 4

Training in progress, step 50

fded158
verified

howardzhou commited on Feb 4

Training in progress, step 250

d9fca68
verified

howardzhou commited on Feb 3

Training in progress, step 200

eead90d
verified

howardzhou commited on Feb 3

Training in progress, step 150

b3cb23a
verified

howardzhou commited on Feb 3

Training in progress, step 100

afddf54
verified

howardzhou commited on Feb 3

Training in progress, step 50

3e4e1e2
verified

howardzhou commited on Feb 3

initial commit

b07c828
verified

howardzhou commited on Feb 3