UnifiedReward 1.0 Qwen Models GGUF - a CodeGoat24 Collection

CodeGoat24 's Collections

Pref-GRPO & UniGenBench

UnifiedReward 2.0 Models

UnifiedReward 1.0 Qwen Models

UnifiedReward 1.0 Qwen Models GGUF

UnifiedReward 1.0 LLaVA Model

UnifiedReward Training Data

UnifiedReward 1.0 Qwen Models GGUF

updated Sep 3

Unified Reward Model for Multimodal Understanding and Generation

Paper • 2503.05236 • Published Mar 7 • 123
Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning

Paper • 2505.03318 • Published May 6 • 93
mradermacher/UnifiedReward-qwen-32b-i1-GGUF

33B • Updated Jul 10 • 269 • 1
mradermacher/UnifiedReward-Think-qwen-7b-i1-GGUF

8B • Updated Jul 10 • 252
mradermacher/UnifiedReward-Think-qwen-7b-GGUF

8B • Updated Jul 31 • 230
mradermacher/UnifiedReward-qwen-7b-i1-GGUF

8B • Updated Jul 10 • 237 • 1
mradermacher/UnifiedReward-qwen-7b-GGUF

8B • Updated Jul 31 • 306 • 1
mradermacher/UnifiedReward-qwen-3b-GGUF

3B • Updated Jul 31 • 203
mradermacher/UnifiedReward-qwen-32b-GGUF

33B • Updated Jul 31 • 221