Componentes con extensiones
Los atributos de extensión son especialmente potentes si se combinan con componentes personalizados del pipeline. En este ejercicio, vas a escribir un componente que encuentre nombres de países y un atributo de extensión personalizado que devuelva la capital de un país, si está disponible.
El objeto nlp ya está creado y la clase Span ya está importada. Tienes un PhraseMatcher con todos los países disponible en la variable matcher. Un diccionario que mapea países a sus capitales está disponible en la variable capitals.
Este ejercicio forma parte del curso
NLP avanzado con spaCy
ejercicio interactivo práctico
Prueba este ejercicio completando este código de ejemplo.
def countries_component(doc):
# Create an entity Span with the label 'GPE' for all matches
doc.ents = [____(____, ____, ____, label=____)
for match_id, start, end in matcher(doc)]
return doc
# Add the component to the pipeline
____.____(____)
print(nlp.pipe_names)