Lematización
Mientras continúas con el análisis de reseñas de usuarios, te has dado cuenta de que el stemming a veces produce palabras no estándar como "fli" a partir de "flying", lo que puede reducir la interpretabilidad. Para solucionarlo, ahora usarás la lematización, que devuelve palabras reales y ayuda a mejorar la claridad y la precisión de tu análisis.
Se ha importado WordNetLemmatizer, se ha definido stop_words y se han descargado los recursos necesarios de NLTK.
Este ejercicio forma parte del curso
Natural Language Processing (NLP) en Python
Instrucciones del ejercicio
- Crea una instancia
lemmatizerde la claseWordNetLemmatizer(). - Usa
lemmatizerpara lematizarlower_tokens.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']
# Create lemmatizer
lemmatizer = ____()
# Lemmatize each token
lemmatized_tokens = [____.____(____) for ____ in clean_tokens]
print(lemmatized_tokens)