chatterbox finetune
Collection
I tested finetune's Chatterbox TTS model on some small languages for the open-source community.
•
3 items
•
Updated

The model is not open access, you can contact me at the email address: [email protected]
"Dobrý den, vítáme vás v našem testu syntézy řeči"
"Tři sta třiatřicet stříbrných křepelek přeletělo přes tři stříbrné střechy"
"Kolik stojí devět tisíc osm set sedmdesát pět korun ?"
"Prosím, nastav hlasitost na sedmdesát procent a přehraj znovu"
"Doktor Křivohlavý napsal článek o umělé inteligenci"
"Zvon zvoní, z dálky zní, ozvěna se vrací do údolí"
First, download the file from huggingface and place it in the current directory.
from chatterbox import mtl_tts
import torchaudio as ta
from safetensors.torch import load_file as load_safetensors
device = "cpu" # or mps or cuda
multilingual_model = mtl_tts.ChatterboxMultilingualTTS.from_pretrained(device=device)
# ----
# Then download the file from huggingface and place it in the current directory.
# ----
t3_state = load_safetensors("t3_cs_v2", device="cpu")
multilingual_model.t3.load_state_dict(t3_state)
multilingual_model.t3.to(device).eval()
czech_text = "Dobrý den, vítáme vás v našem testu syntézy řeči"
wav_czech = multilingual_model.generate(czech_text, language_id="cs")
ta.save("test-cs.wav", wav_czech, model.sr)
Base model
ResembleAI/chatterbox