Componentes complexos
Neste exercício, você vai criar um componente personalizado que usa o PhraseMatcher para encontrar nomes de animais no documento e adicionar os trechos correspondentes a doc.ents.
Um PhraseMatcher com os padrões de animais já foi criado na variável matcher. O modelo pequeno de inglês está disponível na variável nlp. O objeto Span já foi importado para você.
Este exercício faz parte do curso
NLP Avançado com spaCy
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define the custom component
def animal_component(doc):
# Apply the matcher to the doc
matches = ____
# Create a Span for each match and assign the label 'ANIMAL'
spans = [Span(____, ____, ___, label=____)
for match_id, start, end in matches]
# Overwrite the doc.ents with the matched spans
doc.ents = spans
return doc