kevinpro
/

R-PRM-7B-DPO

Text Generation

reinforcement-learning

Model card Files Files and versions

R-PRM-7B-DPO / generation_config.json

kevinpro's picture

Upload folder using huggingface_hub

a4bfcc4 verified 8 months ago

139 Bytes

	{
	"bos_token_id": 151643,
	"eos_token_id": [
	151645,
	151643
	],
	"pad_token_id": 151643,
	"transformers_version": "4.47.1"
	}