nieshen's picture

8 28 1

nieshen

nieshen

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Parallel Loop Transformer for Efficient Test-Time Computation Scaling

upvoted a paper 3 days ago

Uniform Discrete Diffusion with Metric Path for Video Generation

upvoted a paper 3 days ago

FARMER: Flow AutoRegressive Transformer over Pixels

View all activity

Organizations

upvoted a paper 2 days ago

Parallel Loop Transformer for Efficient Test-Time Computation Scaling

Paper • 2510.24824 • Published 3 days ago • 12

upvoted 2 papers 3 days ago

Uniform Discrete Diffusion with Metric Path for Video Generation

Paper • 2510.24717 • Published 3 days ago • 39

FARMER: Flow AutoRegressive Transformer over Pixels

Paper • 2510.23588 • Published 4 days ago • 53

upvoted a paper 15 days ago

LaSeR: Reinforcement Learning with Last-Token Self-Rewarding

Paper • 2510.14943 • Published 15 days ago • 37

upvoted a paper 21 days ago

Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding

Paper • 2510.06308 • Published 24 days ago • 52

upvoted a paper 28 days ago

dParallel: Learnable Parallel Decoding for dLLMs

Paper • 2509.26488 • Published Sep 30 • 19

upvoted 2 papers about 1 month ago

Language Models Can Learn from Verbal Feedback Without Scalar Rewards

Paper • 2509.22638 • Published Sep 26 • 67

Variational Reasoning for Language Models

Paper • 2509.22637 • Published Sep 26 • 68

upvoted 2 papers about 2 months ago

Inpainting-Guided Policy Optimization for Diffusion Large Language Models

Paper • 2509.10396 • Published Sep 12 • 15

Revolutionizing Reinforcement Learning Framework for Diffusion Large Language Models

Paper • 2509.06949 • Published Sep 8 • 56

upvoted 3 papers 2 months ago

UltraMemV2: Memory Networks Scaling to 120B Parameters with Superior Long-Context Learning

Paper • 2508.18756 • Published Aug 26 • 36

Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs

Paper • 2508.14896 • Published Aug 20 • 22

A Survey on Diffusion Language Models

Paper • 2508.10875 • Published Aug 14 • 34

upvoted 6 papers 3 months ago

Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing

Paper • 2508.09192 • Published Aug 8 • 30

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

Paper • 2508.09138 • Published Aug 12 • 36

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

Paper • 2508.02193 • Published Aug 4 • 130

Beyond Fixed: Variable-Length Denoising for Diffusion Large Language Models

Paper • 2508.00819 • Published Aug 1 • 62

Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

Paper • 2507.23726 • Published Jul 31 • 113

The Devil behind the mask: An emergent safety vulnerability of Diffusion LLMs

Paper • 2507.11097 • Published Jul 15 • 64

upvoted a paper 5 months ago

Reinforcement Pre-Training

Paper • 2506.08007 • Published Jun 9 • 262