#!/usr/bin/env python3 """ VINCIE Service UI (Gradio) — Multi-GPU Pool Manager - Importa e utiliza o singleton 'vince_pool_manager_singleton'. - A instância do manager é criada uma única vez no primeiro import, mantendo os modelos "quentes" em todas as GPUs disponíveis. - A UI do Gradio despacha as tarefas para o pool manager, que as distribui automaticamente entre os workers da GPU. - UI minimalista: galeria e vídeo por aba, com opções avançadas. """ import os import gradio as gr from pathlib import Path from typing import List, Tuple, Optional # ============================================================================== # <<< PONTO CENTRAL DA INTEGRAÇÃO >>> # Importamos o singleton do nosso novo pool manager. # A inicialização pesada (download, carregamento de modelos para 4 GPUs) # acontece automaticamente dentro deste módulo na primeira vez que ele é importado. # ============================================================================== try: from services.vince_pool_manager import vince_pool_manager_singleton as server except Exception as e: print(f"ERRO FATAL: Não foi possível importar o VincePoolManager. A aplicação não pode iniciar.") print(f"Detalhe do erro: {e}") # Se o import falhar, a aplicação não tem como funcionar. # Lançamos um erro para que os logs mostrem claramente o problema. raise RuntimeError("Falha na inicialização do VincePoolManager.") from e # Verificação para garantir que o singleton foi criado com sucesso. if server is None: raise RuntimeError("O VincePoolManager não foi inicializado corretamente. Verifique os logs de erro.") # --- Funções Utilitárias --- def _list_media(out_dir: Path, max_images: int = 24) -> Tuple[List[str], Optional[str]]: """Busca os arquivos de imagem e vídeo mais recentes no diretório de saída.""" # Esta função não precisa de alterações. img_globs = ("*.png", "*.jpg", "*.jpeg", "*.webp") images: List[Path] = [] for pat in img_globs: images += list(out_dir.rglob(pat)) # Ordena por data de modificação para pegar os mais recentes images = sorted(images, key=lambda p: p.stat().st_mtime, reverse=True) if images else [] image_paths = [str(p) for p in images[:max_images]] videos = sorted(out_dir.rglob("*.mp4"), key=lambda p: p.stat().st_mtime, reverse=True) video_path = str(videos[0]) if videos else None return image_paths, video_path # --- Funções de Callback da UI (Handlers) --- def ui_multi_turn( input_image: Optional[str], turns_text: Optional[str], steps_input: int, cfg_scale_input: float, aspect_ratio_input: str, resolution_input: int, progress=gr.Progress(track_tqdm=True) ): """Callback para a aba 'Multi-turn Editing'.""" progress(0.1, desc="Validando entradas...") if not input_image or not Path(input_image).exists(): gr.Warning("Arquivo de imagem de entrada ausente ou inválido.") return [], None if not turns_text or not turns_text.strip(): gr.Warning("As instruções (turns) estão vazias.") return [], None turns = [ln.strip() for ln in turns_text.splitlines() if ln.strip()] try: progress(0.5, desc="Enviando tarefa para o pool de GPUs. Aguardando a inferência...") # A chamada para o servidor agora é limpa e delega todo o trabalho pesado. out_dir = server.generate_multi_turn( input_image=input_image, turns=turns, cfg_scale=float(cfg_scale_input), aspect_ratio=str(aspect_ratio_input), resolution=int(resolution_input), steps=int(steps_input), ) progress(0.9, desc="Inferência concluída. Buscando resultados...") except Exception as e: print(f"[UI][multi_turn] Erro durante a inferência: {e}") # gr.Error exibe uma notificação de erro clara para o usuário. gr.Error(f"Erro na Geração: {e}") return [], None out_path = Path(out_dir) if not out_path.exists(): gr.Warning(f"O diretório de saída '{out_path}' não foi encontrado.") return [], None imgs, vid = _list_media(out_path) if not imgs and not vid: gr.Warning(f"Nenhum arquivo de mídia encontrado no diretório de saída.") return imgs, vid def ui_multi_concept( files: Optional[List[str]], descs_text: Optional[str], final_prompt: Optional[str], steps_input: int, cfg_scale_input: float, aspect_ratio_input: str, resolution_input: int, progress=gr.Progress(track_tqdm=True) ): """Callback para a aba 'Multi-concept Composition'.""" progress(0.1, desc="Validando entradas...") if not files: gr.Warning("Nenhum arquivo de imagem de conceito fornecido.") return [], None if not descs_text or not descs_text.strip(): gr.Warning("As descrições dos conceitos estão vazias.") return [], None if not final_prompt or not final_prompt.strip(): gr.Warning("O prompt final está vazio.") return [], None descs = [ln.strip() for ln in descs_text.splitlines() if ln.strip()] if len(descs) != len(files): gr.Warning(f"O número de descrições ({len(descs)}) não corresponde ao número de imagens ({len(files)}).") return [], None try: progress(0.5, desc="Enviando tarefa para o pool de GPUs. Aguardando a inferência...") out_dir = server.generate_multi_concept( concept_images=files, concept_prompts=descs, final_prompt=final_prompt, cfg_scale=float(cfg_scale_input), aspect_ratio=str(aspect_ratio_input), resolution=int(resolution_input), steps=int(steps_input), pad_placeholder=False, # Este parâmetro pode ser exposto na UI se necessário ) progress(0.9, desc="Inferência concluída. Buscando resultados...") except Exception as e: print(f"[UI][multi_concept] Erro durante a inferência: {e}") gr.Error(f"Erro na Geração: {e}") return [], None out_path = Path(out_dir) imgs, vid = _list_media(out_path) return imgs, vid # --- Definição da Interface Gráfica com Gradio --- with gr.Blocks(title="VINCIE (Multi-GPU)") as demo: gr.Markdown("# 🎨 VINCIE — Edição e Composição (Multi-GPU)") gr.Markdown("Esta interface utiliza um pool de GPUs para processar as solicitações de forma rápida e paralela.") # Opções Avançadas são definidas uma vez e reutilizadas nas abas with gr.Accordion("Opções Avançadas (Comum a todas as abas)", open=False): steps_input = gr.Slider(label="Passos de Inferência", minimum=10, maximum=100, step=1, value=50) cfg_scale_input = gr.Slider(label="Escala de Orientação (CFG)", minimum=1.0, maximum=15.0, step=0.5, value=7.5) aspect_ratio_input = gr.Dropdown( label="Proporção da Imagem (Aspect Ratio)", choices=["keep_ratio", "1:1", "16:9", "9:16", "4:3", "3:4"], value="keep_ratio", ) resolution_input = gr.Slider(label="Resolução (lado menor)", minimum=256, maximum=1024, step=64, value=512) with gr.Tabs(): # Aba 1 — Multi-turn Editing with gr.TabItem("Edição Sequencial (Multi-turn)"): with gr.Row(): with gr.Column(scale=1): img_in_1 = gr.Image(type="filepath", label="Imagem de Entrada") turns_in_1 = gr.Textbox(lines=8, label="Instruções de Edição (uma por linha)") run_btn_1 = gr.Button("Gerar Edição", variant="primary") with gr.Column(scale=2): gallery_out_1 = gr.Gallery(label="Imagens Geradas", columns=4, height="auto") video_out_1 = gr.Video(label="Vídeo Gerado (se aplicável)") run_btn_1.click( fn=ui_multi_turn, inputs=[img_in_1, turns_in_1, steps_input, cfg_scale_input, aspect_ratio_input, resolution_input], outputs=[gallery_out_1, video_out_1], ) # Aba 2 — Multi-concept Composition with gr.TabItem("Composição de Conceitos (Multi-concept)"): with gr.Row(): with gr.Column(scale=1): files_in_2 = gr.File(file_count="multiple", type="filepath", label="Imagens de Conceito") descs_in_2 = gr.Textbox(lines=8, label="Descrições (uma por linha, na mesma ordem das imagens)") final_prompt_in_2 = gr.Textbox(lines=2, label="Prompt Final da Composição") run_btn_2 = gr.Button("Gerar Composição", variant="primary") with gr.Column(scale=2): gallery_out_2 = gr.Gallery(label="Imagens Geradas", columns=4, height="auto") video_out_2 = gr.Video(label="Vídeo Gerado (se aplicável)") run_btn_2.click( fn=ui_multi_concept, inputs=[files_in_2, descs_in_2, final_prompt_in_2, steps_input, cfg_scale_input, aspect_ratio_input, resolution_input], outputs=[gallery_out_2, video_out_2], ) # --- Ponto de Entrada da Aplicação --- if __name__ == "__main__": # Busca as configurações do servidor a partir de variáveis de ambiente, com valores padrão. server_name = os.getenv("GRADIO_SERVER_NAME", "0.0.0.0") server_port = int(os.getenv("GRADIO_SERVER_PORT", "7860")) print(f"Iniciando a interface Gradio em http://{server_name}:{server_port}") demo.launch( server_name=server_name, server_port=server_port, # allowed_paths é importante para que o Gradio possa servir os arquivos de resultado allowed_paths=["/app/outputs", "/app/ckpt"], show_error=True, # Exibe tracebacks de erro detalhados no navegador (bom para depuração) )