Etiquetado POS con spaCy
En este ejercicio, practicarás el etiquetado POS. El etiquetado POS es una herramienta útil en NLP porque permite a los algoritmos entender la estructura gramatical de una oración y desambiguar palabras con múltiples significados como watch y play.
Para este ejercicio, en_core_web_sm ya se ha cargado como nlp. Se te han proporcionado tres comentarios del conjunto de datos Airline Travel Information System (ATIS) en una lista llamada texts.
Este ejercicio forma parte del curso
Procesamiento del Lenguaje Natural con spaCy
Instrucciones del ejercicio
- Crea
documents, una lista con todos los contenedoresdocpara cada texto de la listatextsusando una list comprehension. - Para cada contenedor
doc, imprime el texto de cada token y su etiqueta POS correspondiente iterando sobredocumentsy los tokens de cada contenedordoccon un bucle for anidado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Compile a list of all Doc containers of texts
documents = [____(text) for text in texts]
# Print token texts and POS tags for each Doc container
for doc in documents:
for ____ in doc:
print("Text: ", ____, "| POS tag: ", ____)
print("\n")