Procesamiento de texto con spaCy
Toda aplicación de NLP consta de varios pasos de procesamiento de texto. Ya has aprendido algunos de estos pasos, como la tokenización, la lematización, la segmentación en oraciones y el reconocimiento de entidades con nombre.
En este ejercicio, seguirás practicando pasos de procesamiento de texto en spaCy, como dividir el texto en oraciones y extraer entidades con nombre. Utilizarás las cinco primeras reseñas del conjunto de datos Amazon Fine Food Reviews para este ejercicio. Puedes acceder a estas reseñas usando el objeto texts.
El modelo en_core_web_sm ya está cargado para que lo uses y puedes acceder a él con nlp. La lista de contenedores Doc para cada elemento en texts también está precargada y es accesible en documents.
Este ejercicio forma parte del curso
Procesamiento del Lenguaje Natural con spaCy
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a list to store sentences of each Doc container in documents
sentences = [[____ for sent in doc.____] for doc in documents]
# Print number of sentences in each Doc container in documents
num_sentences = [len(____) for s in sentences]
print("Number of sentences in documents:\n", ____)