IRM High Ver

DeBERTa-v3-large をベースにした Idea Reward Model(不確実性回帰 + Isotonic 校正)。 入力: タイトル + アブストラクト → 回帰スコア(μ)と 0–1 の報酬にマッピング。

Downloads last month
187
Safetensors
Model size
0.4B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support