EmpezarEmpieza gratis

Componentes con extensiones

Los atributos de extensión son especialmente potentes si se combinan con componentes personalizados del pipeline. En este ejercicio, vas a escribir un componente que encuentre nombres de países y un atributo de extensión personalizado que devuelva la capital de un país, si está disponible.

El objeto nlp ya está creado y la clase Span ya está importada. Tienes un PhraseMatcher con todos los países disponible en la variable matcher. Un diccionario que mapea países a sus capitales está disponible en la variable capitals.

Este ejercicio forma parte del curso

NLP avanzado con spaCy

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

def countries_component(doc):
    # Create an entity Span with the label 'GPE' for all matches
    doc.ents = [____(____, ____, ____, label=____)
                for match_id, start, end in matcher(doc)]
    return doc

# Add the component to the pipeline
____.____(____)
print(nlp.pipe_names)
Editar y ejecutar código