ComenzarEmpieza gratis

Etiquetado POS con spaCy

En este ejercicio, practicarás el etiquetado POS. El etiquetado POS es una herramienta útil en NLP porque permite a los algoritmos entender la estructura gramatical de una oración y desambiguar palabras con múltiples significados como watch y play.

Para este ejercicio, en_core_web_sm ya se ha cargado como nlp. Se te han proporcionado tres comentarios del conjunto de datos Airline Travel Information System (ATIS) en una lista llamada texts.

Este ejercicio forma parte del curso

Procesamiento del Lenguaje Natural con spaCy

Ver curso

Instrucciones del ejercicio

  • Crea documents, una lista con todos los contenedores doc para cada texto de la lista texts usando una list comprehension.
  • Para cada contenedor doc, imprime el texto de cada token y su etiqueta POS correspondiente iterando sobre documents y los tokens de cada contenedor doc con un bucle for anidado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Compile a list of all Doc containers of texts
documents = [____(text) for text in texts]

# Print token texts and POS tags for each Doc container
for doc in documents:
    for ____ in doc:
        print("Text: ", ____, "| POS tag: ", ____)
    print("\n")
Editar y ejecutar código