ComenzarEmpieza gratis

Lematización

Mientras continuabas con tu análisis de las reseñas de los usuarios, observaste que la derivación a veces produce palabras no estándar como «fli» a partir de «flying», lo que puede reducir la interpretabilidad. Para solucionar esto, ahora utilizarás la lematización, que devuelve las palabras reales y ayuda a mejorar la claridad y la precisión de tu análisis.

WordNetLemmatizer se ha importado, se ha definido stop_words y se han descargado los recursos NLTK necesarios.

Este ejercicio forma parte del curso

Procesamiento del lenguaje natural (NLP) en Python

Ver curso

Instrucciones del ejercicio

  • Crea una instancia lemmatizer de la clase WordNetLemmatizer().
  • Utiliza el diccionario de lematización lemmatizer para lematizar el diccionario de lematización lower_tokens.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create lemmatizer
lemmatizer = ____()

# Lemmatize each token
lemmatized_tokens = [____.____(____) for ____ in clean_tokens]

print(lemmatized_tokens)
Editar y ejecutar código