Stemming
Ahora que has limpiado el texto de review y eliminado las stop words y la puntuación, ya puedes normalizar las palabras restantes con stemming para reducirlas a su forma raíz. Esto ayuda a agrupar términos similares, haciendo que tu análisis sea más coherente y eficiente.
Se te ha proporcionado la clase PorterStemmer, junto con una lista de clean_tokens.
Este ejercicio forma parte del curso
Natural Language Processing (NLP) en Python
Instrucciones del ejercicio
- Inicializa
PorterStemmer(). - Usa una list comprehension para aplicar stemming a cada token de la lista
clean_tokens.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']
# Create stemmer
stemmer = ____()
# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]
print(stemmed_tokens)