ComeçarComece de graça

Radicalização

Agora que você limpou o texto review e tirou as palavras desnecessárias e a pontuação, tá pronto pra normalizar as palavras que sobraram usando o stemming pra reduzir as palavras à sua forma raiz. Isso ajuda a juntar palavras parecidas, deixando sua análise mais consistente e eficiente.

A classe PorterStemmer foi fornecida, junto com uma lista de clean_tokens.

Este exercício faz parte do curso

Processamento de Linguagem Natural (NLP) em Python

Ver curso

Instruções do exercício

  • Inicialize o PorterStemmer().
  • Use uma compreensão de lista para extrair cada token da lista clean_tokens.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create stemmer
stemmer = ____()

# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]

print(stemmed_tokens)
Editar e executar o código