kevinpro
/

R-PRM-7B-DPO

Text Generation

reinforcement-learning

Model card Files Files and versions

Commit History

Upload README.md with huggingface_hub

b7ce17c
verified

kevinpro commited on Mar 28

Upload folder using huggingface_hub

4863973
verified

kevinpro commited on Mar 28

Upload README.md with huggingface_hub

acd3d88
verified

kevinpro commited on Mar 28

Upload README.md with huggingface_hub

926beb4
verified

kevinpro commited on Mar 28

Upload folder using huggingface_hub

a4bfcc4
verified

kevinpro commited on Mar 28

initial commit

2672c9f
verified

kevinpro commited on Mar 28