YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

CRF Address NER Model (Pipeline Version)

Descrição

Modelo Conditional Random Field (CRF) com Pipeline sklearn para Named Entity Recognition em endereços brasileiros.

Novidade: Pipeline Completo

Esta versão (v2.0.0) usa sklearn Pipeline, incluindo:

  • ✅ Feature Extractor (preprocessamento automático)
  • ✅ CRF Tagger (modelo de sequência)
  • ✅ Zero código adicional necessário para inferência

Informações do Modelo

  • Acurácia: 0.9995
  • Algoritmo: lbfgs
  • Labels: 13

Vantagens sobre HMM

  • ✅ Modela dependências contextuais (palavras vizinhas)
  • ✅ Não assume independência entre observações
  • ✅ Otimização global da sequência
  • ✅ Mesmas features morfológicas + contexto rico

Como Usar

import joblib
from huggingface_hub import hf_hub_download

# Download do pipeline
pipeline_path = hf_hub_download(
    repo_id="felipergcpqd/crf-address-ner-pt",
    filename="pipeline.joblib"
)

# Carregar
pipeline = joblib.load(pipeline_path)

# Usar (ZERO código de features necessário!)
tokens = [["Rua", "das", "Flores", "123", "São", "Paulo", "SP"]]
predictions = pipeline.predict(tokens)
print(predictions[0])

Comparação com HMM

Característica HMM CRF
Features morfológicas ✅ 11 features ✅ 11 features (mesmas)
Features contextuais ❌ Não ✅ Sim (vizinhança)
Otimização Local (Viterbi) Global (sequência inteira)
Independência Assume Não assume
Transições 1ª ordem (Markov) Todas possíveis

Treinamento

  • Data: 2025-11-19
  • Versão: 2.0.0 (Pipeline sklearn)
  • Regularização: L1 (c1=0.1) + L2 (c2=0.1)
Downloads last month
61
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support