ComenzarEmpieza gratis

Derivación

Ahora que has limpiado el texto « review » y has eliminado las palabras vacías y la puntuación, estás listo para normalizar las palabras restantes utilizando la derivación para reducir las palabras a su forma raíz. Esto ayuda a agrupar palabras similares, lo que hace que tu análisis sea más coherente y eficiente.

Se ha proporcionado la clase « PorterStemmer », junto con una lista de « clean_tokens ».

Este ejercicio forma parte del curso

Procesamiento del lenguaje natural (NLP) en Python

Ver curso

Instrucciones del ejercicio

  • Inicializa el PorterStemmer().
  • Utiliza una comprensión de lista para derivar cada token de la lista « clean_tokens ».

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create stemmer
stemmer = ____()

# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]

print(stemmed_tokens)
Editar y ejecutar código