Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2501.12948

Rewnozom/agent-zero-v1-a-01

Text Generation • 4B • Updated Jan 18 • 1
TheBloke/MythoMax-L2-13B-GGUF

13B • Updated Sep 27, 2023 • 57.7k • 196
DavidAU/Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B-GGUF

Text Generation • 18B • Updated Jul 28 • 49.9k • 383
QuantFactory/DarkIdol-Llama-3.1-8B-Instruct-1.2-Uncensored-GGUF

Text Generation • 8B • Updated Jul 29, 2024 • 12.9k • 118

Running

15.5k

15.5k

DeepSite v3

🐳

Generate any application by Vibe Coding
deepseek-ai/DeepSeek-R1-0528

Text Generation • 685B • Updated May 29 • 568k • • 2.38k
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420
open-r1/Mixture-of-Thoughts

Viewer • Updated May 26 • 699k • 5.53k • 284

ibm-granite/granite-3.2-8b-instruct

Text Generation • 8B • Updated Apr 17 • 4.36k • 87
deepseek-ai/DeepSeek-V3-0324

Text Generation • 685B • Updated Mar 27 • 315k • • 3.07k
Qwen/Qwen2.5-Omni-7B

Any-to-Any • 11B • Updated Apr 30 • 245k • 1.81k
nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8 • 3.91M • 3.79k • 592

The Deepseek AI Collection

Papers and Models by Deepseek AI

deepseek-ai/DeepSeek-V3-0324

Text Generation • 685B • Updated Mar 27 • 315k • • 3.07k
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420
deepseek-ai/DeepSeek-R1

Text Generation • 685B • Updated Mar 27 • 462k • • 12.8k
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

Paper • 2402.03300 • Published Feb 5, 2024 • 129

文本转图像01

Running on Zero

9.19k

9.19k

FLUX.1 [dev]

🖥

Generate images from text prompts
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

Paper • 2401.02954 • Published Jan 5, 2024 • 48
DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models

Paper • 2401.06066 • Published Jan 11, 2024 • 56
DeepSeek-Coder: When the Large Language Model Meets Programming -- The Rise of Code Intelligence

Paper • 2401.14196 • Published Jan 25, 2024 • 66
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

Paper • 2402.03300 • Published Feb 5, 2024 • 129

A very long nameA very long nameA very long nameA very long

A very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very

nvidia/OpenMathReasoning

Viewer • Updated May 27 • 5.68M • 5.71k • 345
zwhe99/DeepMath-103K

Viewer • Updated May 29 • 103k • 6.87k • 251
microsoft/bitnet-b1.58-2B-4T

Text Generation • 0.8B • Updated May 1 • 11.4k • 1.21k
Running

790

790

Qwen3 Demo

📊

Generate responses to text prompts in a chat interface

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420
nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8 • 3.91M • 3.79k • 592

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420

To Read collection

interesting papers to read

Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model

Paper • 2503.24290 • Published Mar 31 • 62
I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 119
START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published Mar 6 • 113
DAPO: An Open-Source LLM Reinforcement Learning System at Scale

Paper • 2503.14476 • Published Mar 18 • 141

Rewnozom/agent-zero-v1-a-01

Text Generation • 4B • Updated Jan 18 • 1
TheBloke/MythoMax-L2-13B-GGUF

13B • Updated Sep 27, 2023 • 57.7k • 196
DavidAU/Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B-GGUF

Text Generation • 18B • Updated Jul 28 • 49.9k • 383
QuantFactory/DarkIdol-Llama-3.1-8B-Instruct-1.2-Uncensored-GGUF

Text Generation • 8B • Updated Jul 29, 2024 • 12.9k • 118

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

Paper • 2401.02954 • Published Jan 5, 2024 • 48
DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models

Paper • 2401.06066 • Published Jan 11, 2024 • 56
DeepSeek-Coder: When the Large Language Model Meets Programming -- The Rise of Code Intelligence

Paper • 2401.14196 • Published Jan 25, 2024 • 66
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

Paper • 2402.03300 • Published Feb 5, 2024 • 129

Running

15.5k

15.5k

DeepSite v3

🐳

Generate any application by Vibe Coding
deepseek-ai/DeepSeek-R1-0528

Text Generation • 685B • Updated May 29 • 568k • • 2.38k
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420
open-r1/Mixture-of-Thoughts

Viewer • Updated May 26 • 699k • 5.53k • 284

A very long nameA very long nameA very long nameA very long

A very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very

nvidia/OpenMathReasoning

Viewer • Updated May 27 • 5.68M • 5.71k • 345
zwhe99/DeepMath-103K

Viewer • Updated May 29 • 103k • 6.87k • 251
microsoft/bitnet-b1.58-2B-4T

Text Generation • 0.8B • Updated May 1 • 11.4k • 1.21k
Running

790

790

Qwen3 Demo

📊

Generate responses to text prompts in a chat interface

ibm-granite/granite-3.2-8b-instruct

Text Generation • 8B • Updated Apr 17 • 4.36k • 87
deepseek-ai/DeepSeek-V3-0324

Text Generation • 685B • Updated Mar 27 • 315k • • 3.07k
Qwen/Qwen2.5-Omni-7B

Any-to-Any • 11B • Updated Apr 30 • 245k • 1.81k
nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8 • 3.91M • 3.79k • 592

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420
nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8 • 3.91M • 3.79k • 592

The Deepseek AI Collection

Papers and Models by Deepseek AI

deepseek-ai/DeepSeek-V3-0324

Text Generation • 685B • Updated Mar 27 • 315k • • 3.07k
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420
deepseek-ai/DeepSeek-R1

Text Generation • 685B • Updated Mar 27 • 462k • • 12.8k
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

Paper • 2402.03300 • Published Feb 5, 2024 • 129

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420

文本转图像01

Running on Zero

9.19k

9.19k

FLUX.1 [dev]

🖥

Generate images from text prompts
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420

To Read collection

interesting papers to read

Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model

Paper • 2503.24290 • Published Mar 31 • 62
I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 119
START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published Mar 6 • 113
DAPO: An Open-Source LLM Reinforcement Learning System at Scale

Paper • 2503.14476 • Published Mar 18 • 141

Previous
1
2
3
4
5
...
12
Next

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs