Componentes com extensões
Atributos de extensão ficam ainda mais poderosos quando combinados com componentes personalizados do pipeline. Neste exercício, você vai escrever um componente que encontra nomes de países e um atributo de extensão personalizado que retorna a capital do país, quando disponível.
O objeto nlp já foi criado e a classe Span já foi importada. Um phrase matcher com todos os países está disponível na variável matcher. Um dicionário com países mapeados para suas capitais está disponível na variável capitals.
Este exercício faz parte do curso
NLP Avançado com spaCy
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def countries_component(doc):
# Create an entity Span with the label 'GPE' for all matches
doc.ents = [____(____, ____, ____, label=____)
for match_id, start, end in matcher(doc)]
return doc
# Add the component to the pipeline
____.____(____)
print(nlp.pipe_names)