trillionlabs
/

Tri-1.8B-Translation

text-generation

text-generation-inference

Model card Files Files and versions

juyoung-trl commited on Aug 29

Commit

7f64c04

·

verified ·

1 Parent(s): b3b8c5a

Update README.md

Files changed (1) hide show

README.md +27 -7

README.md CHANGED Viewed

@@ -48,13 +48,33 @@ Where `{lang_tag} ∈ { en, ko, ja, zh }`.
 ```python
 from transformers import AutoTokenizer, AutoModelForCausalLM
-tok = AutoTokenizer.from_pretrained("trillionlabs/Tri-1.8B-Translation")
-model = AutoModelForCausalLM.from_pretrained("trillionlabs/Tri-1.8B-Translation", device_map="auto")
-prompt = "Translate the following Korean text into English:\n안녕하세요 <en>"
-inputs = tok(prompt, return_tensors="pt").to(model.device)
-out = model.generate(**inputs, max_new_tokens=128)
-print(tok.decode(out[0], skip_special_tokens=True))
 ```
 ---

 ```python
 from transformers import AutoTokenizer, AutoModelForCausalLM
+model_name = "trillionlabs/Tri-1.8B-Translation"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
+text = "안녕하세요"
+messages = [
+    {"role": "user", "content": f"Translate the following Korean text into English:\n{text} <en>"}
+]
+inputs = tokenizer.apply_chat_template(
+    messages,
+    return_tensors="pt",
+    add_generation_prompt=True
+).to(model.device)
+outputs = model.generate(
+    inputs,
+    max_new_tokens=256,
+    do_sample=False,
+    pad_token_id=tokenizer.eos_token_id
+)
+full_output = tokenizer.decode(outputs[0], skip_special_tokens=True)
+translation = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)
+print(f"Korean: {text}")
+print(f"English: {translation}")
 ```
 ---