German-OCR 2B (GGUF)

Kompaktes Vision-Language Modell für deutsche Dokumenten-OCR.

Highlights

1.5 GB - Läuft auf jedem Laptop
100% Genauigkeit auf deutschen Dokumenten
GPU/NPU-Support: CUDA, Metal, Vulkan, OpenVINO
CPU-Inferenz ohne GPU möglich

Dateien

Datei	Größe	Beschreibung
`German-OCR-Engine.2B.gguf`	1.03 GB	LLM Engine (Q4_K)
`German-OCR-Worker-2B.gguf`	424 MB	Vision Encoder

Verwendung mit llama.cpp

llama-mtmd-cli \
  -m German-OCR-Engine.2B.gguf \
  --mmproj German-OCR-Worker-2B.gguf \
  --image rechnung.png \
  -p "Extrahiere den Text aus diesem Dokument:" \
  -ngl 99

Verwendung mit Python

pip install german-ocr[llamacpp]

from german_ocr import GermanOCR

ocr = GermanOCR(backend="llamacpp")
text = ocr.extract("rechnung.png")
print(text)

Performance

Hardware	Speed	Accuracy
RTX 4060	127 tok/s	100%
CPU-only	23 tok/s	100%

Lizenz

Apache 2.0

Autor

Keyvan Hardani - keyvan.ai

Downloads last month: 117

GGUF

Model size

2B params

Architecture

qwen3vl

Hardware compatibility

We're not able to determine the quantization variants.

View all variants

Model tree for Keyven/german-ocr-2b-gguf

Base model

Qwen/Qwen3-VL-2B-Instruct

Quantized

(37)

this model

Keyven
/

german-ocr-2b-gguf