Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2508.02324

EVA-CLIP-18B: Scaling CLIP to 18 Billion Parameters

Paper • 2402.04252 • Published Feb 6, 2024 • 28
Vision Superalignment: Weak-to-Strong Generalization for Vision Foundation Models

Paper • 2402.03749 • Published Feb 6, 2024 • 14
ScreenAI: A Vision-Language Model for UI and Infographics Understanding

Paper • 2402.04615 • Published Feb 7, 2024 • 44
EfficientViT-SAM: Accelerated Segment Anything Model Without Performance Loss

Paper • 2402.05008 • Published Feb 7, 2024 • 23

Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Packing Input Frame Context in Next-Frame Prediction Models for Video Generation

Paper • 2504.12626 • Published Apr 17 • 51
Qwen3 Technical Report

Paper • 2505.09388 • Published May 14 • 305
Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258
DINOv3

Paper • 2508.10104 • Published Aug 13 • 274

Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Running on Zero

672

672

Qwen Image Edit

✒

Edit images based on user instructions
Running on Zero

846

846

Qwen Image

🖼

Generate images from text prompts
Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258
Qwen/Qwen-Image-Edit

Image-to-Image • Updated Aug 25 • 187k • • 2.06k

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420
Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published Feb 19 • 207
Qwen3 Technical Report

Paper • 2505.09388 • Published May 14 • 305
Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Qwen Image Universe

Qwen/Qwen-Image

Text-to-Image • Updated Aug 18 • 189k • • 2.14k
Qwen/Qwen-Image-Edit

Image-to-Image • Updated Aug 25 • 187k • • 2.06k
Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worlds from Words or Pixels

Paper • 2507.21809 • Published Jul 29 • 131
OmniPart: Part-Aware 3D Generation with Semantic Decoupling and Structural Cohesion

Paper • 2507.06165 • Published Jul 8 • 58
DINOv3

Paper • 2508.10104 • Published Aug 13 • 274
Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

EVA-CLIP-18B: Scaling CLIP to 18 Billion Parameters

Paper • 2402.04252 • Published Feb 6, 2024 • 28
Vision Superalignment: Weak-to-Strong Generalization for Vision Foundation Models

Paper • 2402.03749 • Published Feb 6, 2024 • 14
ScreenAI: A Vision-Language Model for UI and Infographics Understanding

Paper • 2402.04615 • Published Feb 7, 2024 • 44
EfficientViT-SAM: Accelerated Segment Anything Model Without Performance Loss

Paper • 2402.05008 • Published Feb 7, 2024 • 23

Running on Zero

672

672

Qwen Image Edit

✒

Edit images based on user instructions
Running on Zero

846

846

Qwen Image

🖼

Generate images from text prompts
Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258
Qwen/Qwen-Image-Edit

Image-to-Image • Updated Aug 25 • 187k • • 2.06k

Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420
Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published Feb 19 • 207
Qwen3 Technical Report

Paper • 2505.09388 • Published May 14 • 305
Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Qwen Image Universe

Qwen/Qwen-Image

Text-to-Image • Updated Aug 18 • 189k • • 2.14k
Qwen/Qwen-Image-Edit

Image-to-Image • Updated Aug 25 • 187k • • 2.06k
Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Packing Input Frame Context in Next-Frame Prediction Models for Video Generation

Paper • 2504.12626 • Published Apr 17 • 51
Qwen3 Technical Report

Paper • 2505.09388 • Published May 14 • 305
Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258
DINOv3

Paper • 2508.10104 • Published Aug 13 • 274

HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worlds from Words or Pixels

Paper • 2507.21809 • Published Jul 29 • 131
OmniPart: Part-Aware 3D Generation with Semantic Decoupling and Structural Cohesion

Paper • 2507.06165 • Published Jul 8 • 58
DINOv3

Paper • 2508.10104 • Published Aug 13 • 274
Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 258

Previous
1
2
3
Next

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs