JayHyeon
/

Qwen_0.5-VDPO_5e-7_0.3vpo_constant_ls0.0_seed42

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen_0.5-VDPO_5e-7_0.3vpo_constant_ls0.0_seed42

Commit History

End of training

fba3830
verified

JayHyeon commited on Aug 14

Model save

bbf7575
verified

JayHyeon commited on Aug 14

Training in progress, step 5449

cac8753
verified

JayHyeon commited on Aug 14

initial commit

395a557
verified

JayHyeon commited on Aug 14