Spaces:

Robadeldesouza
/

MEaCHATBOT1

Sleeping

Robadeldesouza commited on Sep 22

Commit

2ab9a23

verified ·

1 Parent(s): 93ca302

Upload 2 files

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,25 +1,24 @@
 import gradio as gr
-from transformers import pipeline
-# Carrega modelo StarCoder otimizado para geração de código
-generator = pipeline("text-generation", model="bigcode/starcoder", device=-1)
 def chat(message, history):
-    history = history or []
-    response = generator(message, max_new_tokens=200, do_sample=True, temperature=0.2)[0]["generated_text"]
-    # Pega apenas a resposta após a mensagem do usuário
-    response = response[len(message):].strip()
-    history.append((message, response))
-    return history, history
-with gr.Blocks(css="style.css") as demo:
-    gr.Markdown("# 💬 StarCoder Chat\nDigite sua mensagem abaixo e veja a resposta:")
-    chatbot = gr.Chatbot(elem_id="chatbot")
-    msg = gr.Textbox(placeholder="Digite sua mensagem...")
-    clear = gr.Button("Limpar")
-    msg.submit(chat, [msg, chatbot], [chatbot, chatbot])
-    clear.click(lambda: None, None, chatbot)
-demo.launch()

+from ctransformers import AutoModelForCausalLM
 import gradio as gr
+# Carrega CodeLlama 7B Instruct quantizado (GGUF) direto do Hugging Face
+llm = AutoModelForCausalLM.from_pretrained(
+    "TheBloke/CodeLlama-7B-Instruct-GGUF",
+    model_file="codellama-7b-instruct.Q4_K_M.gguf",  # versão leve
+    model_type="llama"
+)
 def chat(message, history):
+    prompt = f"### Instrução:\n{message}\n### Resposta:\n"
+    response = llm(prompt, max_new_tokens=512)
+    return response
+# Layout igual ao anterior (estilo chat)
+iface = gr.ChatInterface(
+    fn=chat,
+    title="MEu ChatBot CodeLlama",
+    description="Assistente de Programação rodando no Hugging Face Spaces (CodeLlama-7B Instruct).",
+    theme="soft"
+)
+iface.launch()

requirements.txt CHANGED Viewed

@@ -1,6 +1,2 @@
-gradio
-transformers
-torch
-sentencepiece
-huggingface-hub
-websockets