NER con spaCy
El reconocimiento de entidades con nombre (NER) te ayuda a identificar fácilmente elementos clave de un documento, como nombres de personas y lugares. Facilita organizar datos no estructurados y detectar información importante, algo crucial cuando trabajas con conjuntos de datos grandes. En este ejercicio, practicarás Named Entity Recognition.
en_core_web_sm se ha cargado por ti como nlp. Se te han proporcionado tres comentarios del conjunto de datos Airline Travel Information System (ATIS) en una lista llamada texts.
Este ejercicio forma parte del curso
Procesamiento del Lenguaje Natural con spaCy
Instrucciones del ejercicio
- Crea
documents, una lista con todos los contenedoresDocpara cada texto detextsusando una list comprehension. - Para cada contenedor
doc, imprime el texto de cada entidad y su etiqueta correspondiente iterando pordoc.ents. - Imprime el texto del sexto token y el tipo de entidad del segundo contenedor
Doc.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Compile a list of all Doc containers of texts
documents = [____ for text in texts]
# Print the entity text and label for the entities in each document
for doc in documents:
print([(____, ____) for ent in ____])
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)