pdelobelle
/

DeepSeek-R1-GGUF-MTP

Model card Files Files and versions

Vedant Nanda commited on Mar 12

Commit

16d194a

·

1 Parent(s): 9410bf2

Initial commit

Files changed (2) hide show

.gitattributes +1 -0
README.md +7 -3

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.gguf filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1,7 @@
----
-license: mit
----

+---
+license: mit
+---
+Quantized MTP head of Deepseek R1. For use with the [Unsloth's Q4_K](https://huggingface.co/unsloth/DeepSeek-R1-GGUF) quants.
+Llama.cpp does not support MTP heads, but vLLM does.