hyung gyu rho's picture

2 2

hyung gyu rho

sirano1004

·

sirano1004

AI & ML interests

None yet

Recent Activity

authored a paper about 1 month ago

Margin Adaptive DPO: Leveraging Reward Model for Granular Control in Preference Optimization

upvoted a paper about 1 month ago

A Contextual Quality Reward Model for Reliable and Efficient Best-of-N Sampling

upvoted a paper about 1 month ago

Margin Adaptive DPO: Leveraging Reward Model for Granular Control in Preference Optimization

View all activity

Organizations

None yet

Papers 2

arxiv:2510.05342

arxiv:2510.04087

models 0

None public yet

datasets 0

None public yet