Componentes con extensiones
Los atributos de extensión son especialmente potentes si se combinan con componentes personalizados del pipeline. En este ejercicio, vas a escribir un componente que encuentre nombres de países y un atributo de extensión personalizado que devuelva la capital de un país, si está disponible.
El objeto nlp ya está creado y la clase Span ya está importada. Tienes un PhraseMatcher con todos los países disponible en la variable matcher. Un diccionario que mapea países a sus capitales está disponible en la variable capitals.
Este ejercicio forma parte del curso
NLP avanzado con spaCy
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def countries_component(doc):
# Create an entity Span with the label 'GPE' for all matches
doc.ents = [____(____, ____, ____, label=____)
for match_id, start, end in matcher(doc)]
return doc
# Add the component to the pipeline
____.____(____)
print(nlp.pipe_names)