ComenzarEmpieza gratis

Procesamiento de texto con spaCy

Toda aplicación de NLP consta de varios pasos de procesamiento de texto. Ya has aprendido algunos de estos pasos, como la tokenización, la lematización, la segmentación en oraciones y el reconocimiento de entidades con nombre.

spaCy NLP Pipeline

En este ejercicio, seguirás practicando pasos de procesamiento de texto en spaCy, como dividir el texto en oraciones y extraer entidades con nombre. Utilizarás las cinco primeras reseñas del conjunto de datos Amazon Fine Food Reviews para este ejercicio. Puedes acceder a estas reseñas usando el objeto texts.

El modelo en_core_web_sm ya está cargado para que lo uses y puedes acceder a él con nlp. La lista de contenedores Doc para cada elemento en texts también está precargada y es accesible en documents.

Este ejercicio forma parte del curso

Procesamiento del Lenguaje Natural con spaCy

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a list to store sentences of each Doc container in documents
sentences = [[____ for sent in doc.____] for doc in documents]

# Print number of sentences in each Doc container in documents
num_sentences = [len(____) for s in sentences]
print("Number of sentences in documents:\n", ____)
Editar y ejecutar código