Korean Stock News Qwen 3B LoRA
๋ชจ๋ธ ๊ฐ์
ํ๊ตญ ์ฃผ์ ๋ด์ค ๋ถ์์ ์ํด Qwen2.5-3B-Instruct๋ฅผ ํ์ธํ๋ํ LoRA ๋ชจ๋ธ์ ๋๋ค.
์ฃผ์ ๊ธฐ๋ฅ
- ๐ฐ ๋ด์ค ์นดํ ๊ณ ๋ฆฌ ๋ถ๋ฅ (domestic_direct/global_related/macro_economic/geopolitical/irrelevant)
- ๐ ์ฃผ์์์ฅ ์ํฅ๋ ๋ถ์
- ๐ข ๊ด๋ จ ๊ธฐ์ ์ถ์ถ
- ๐น ํฌ์ ์ถ์ฒ ์์ฑ
์ฑ๋ฅ
- Base Model: Qwen2.5-3B-Instruct
- Training Time: 37๋ถ (345๋ฐฐ ์ฑ๋ฅ ํฅ์)
- Token Accuracy: 79%
- Training Loss: 0.98
์ฌ์ฉ๋ฒ
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel
# ๋ฒ ์ด์ค ๋ชจ๋ธ ๋ก๋
base_model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen2.5-3B-Instruct")
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2.5-3B-Instruct")
# LoRA ์ด๋ํฐ ์ ์ฉ
model = PeftModel.from_pretrained(base_model, "3kd1000/3kd1000/korean-stock-news-qwen-3b-lora")
ํ์ต ํ๊ฒฝ
- GPU: AMD RX 9070 XT (16GB VRAM)
- CPU: AMD 9800X3D
- RAM: 32GB
- OS: WSL2 Ubuntu 22.04.5 LTS
- Framework: Transformers + PEFT + TRL
๋ผ์ด์ ์ค
Apache 2.0
์ ์์
์ ์ฃผ์ (jsjung)
- Downloads last month
- 15