ComenzarEmpieza gratis

Tokenización con spaCy

En este ejercicio vas a practicar la tokenización de texto. Utilizarás la primera reseña del conjunto de datos Amazon Fine Food Reviews. Puedes acceder a esta reseña usando el objeto text proporcionado.

El modelo en_core_web_sm ya está cargado para ti. Puedes acceder a él llamando a nlp(). Puedes usar comprensión de listas para crear listas de resultados.

Este ejercicio forma parte del curso

Procesamiento del Lenguaje Natural con spaCy

Ver curso

Instrucciones del ejercicio

  • Guarda el contenedor Doc de la reseña precargada en un objeto document.
  • Guarda y revisa los textos de todos los tokens de document en la variable first_text_tokens.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a Doc container of the given text
document = ____(____)
    
# Store and review the token text values of tokens for the Doc container
first_text_tokens = [____ for ____ in ____]
print("First text tokens:\n", first_text_tokens, "\n")
Editar y ejecutar código