Qwen3-ASR-1.7B-Q8

8-bit quantized version of Qwen/Qwen3-ASR-1.7B for MLX.

Quantization

from mlx_qwen3_asr import Session

session = Session("illitan/Qwen3-ASR-1.7B-Q8")
result = session.transcribe("audio.wav")
print(result.text)

Quantized from Qwen/Qwen3-ASR-1.7B using nn.quantize(model, bits=8, group_size=64).

MLX

Hardware compatibility

Quantized

Base model

Finetuned

(61)

this model