Tokenización con spaCy
En este ejercicio vas a practicar la tokenización de texto. Utilizarás la primera reseña del conjunto de datos Amazon Fine Food Reviews. Puedes acceder a esta reseña usando el objeto text proporcionado.
El modelo en_core_web_sm ya está cargado para ti. Puedes acceder a él llamando a nlp(). Puedes usar comprensión de listas para crear listas de resultados.
Este ejercicio forma parte del curso
Procesamiento del Lenguaje Natural con spaCy
Instrucciones del ejercicio
- Guarda el contenedor Doc de la reseña precargada en un objeto
document. - Guarda y revisa los textos de todos los tokens de
documenten la variablefirst_text_tokens.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a Doc container of the given text
document = ____(____)
# Store and review the token text values of tokens for the Doc container
first_text_tokens = [____ for ____ in ____]
print("First text tokens:\n", first_text_tokens, "\n")