ComeçarComece de graça

Radicais a partir de tweets

Neste exercício, você vai trabalhar com um array chamado tweets. Ele contém o texto dos dados de sentimento de companhias aéreas coletados no Twitter.

Sua tarefa é trabalhar com esse array e transformá-lo em uma lista de tokens usando list comprehension. Depois disso, percorra a lista de tokens e crie o radical (stem) de cada token. Lembre-se de que list comprehensions são uma alternativa de uma linha aos laços for.

Este exercício faz parte do curso

Análise de Sentimentos em Python

Ver curso

Instruções do exercício

  • Importe a função que usamos para transformar strings em radicais (stems).
  • Chame a função de stemmer de Porter que você acabou de importar.
  • Usando uma list comprehension, crie a lista tokens. Ela deve conter todos os tokens de palavras do array tweets.
  • Percorra a lista tokens e aplique a função de stemming a cada item da lista.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the function to perform stemming
____
from nltk import word_tokenize

# Call the stemmer
porter = ____()

# Transform the array of tweets to tokens
tokens = [____]
# Stem the list of tokens
stemmed_tokens = [[____.____(word) for word in tweet] for tweet in tokens] 
# Print the first element of the list
print(stemmed_tokens[0])
Editar e executar o código