PEFT модели, дообученные с помощью PEFT для определения тональности сообщений georgebu/peft_lora Text Generation • 0.3B • Updated Apr 11 • 5 georgebu/peft_dora Text Generation • 0.3B • Updated Apr 11 georgebu/peft_tinyllama_qlora Updated Apr 11
Alignment DPO model, PPO model, reward model georgebu/reward_model Text Classification • 0.1B • Updated Mar 28 georgebu/dpo_model Text Generation • 0.1B • Updated Mar 28 georgebu/ppo_model Text Generation • 0.1B • Updated Mar 28
PEFT модели, дообученные с помощью PEFT для определения тональности сообщений georgebu/peft_lora Text Generation • 0.3B • Updated Apr 11 • 5 georgebu/peft_dora Text Generation • 0.3B • Updated Apr 11 georgebu/peft_tinyllama_qlora Updated Apr 11
Alignment DPO model, PPO model, reward model georgebu/reward_model Text Classification • 0.1B • Updated Mar 28 georgebu/dpo_model Text Generation • 0.1B • Updated Mar 28 georgebu/ppo_model Text Generation • 0.1B • Updated Mar 28