Stemming
Agora que você limpou o texto review e removeu stop words e pontuação, está pronto para normalizar as palavras restantes usando stemming para reduzir as palavras à sua forma raiz. Isso ajuda a agrupar termos semelhantes, deixando sua análise mais consistente e eficiente.
A classe PorterStemmer foi fornecida, junto com uma lista de clean_tokens.
Este exercício faz parte do curso
Processamento de Linguagem Natural (NLP) em Python
Instruções do exercício
- Inicialize o
PorterStemmer(). - Use uma list comprehension para aplicar stemming em cada token da lista
clean_tokens.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']
# Create stemmer
stemmer = ____()
# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]
print(stemmed_tokens)