AmberYifan
/

Qwen2.5-14B-Instruct-wildfeedback-RPO-DRIFT-iter1-4k

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-14B-Instruct-wildfeedback-RPO-DRIFT-iter1-4k / model-00003-of-00006.safetensors

Commit History

Training in progress, epoch 1

b60873b
verified

AmberYifan commited on Aug 4