Radicais a partir de tweets
Neste exercício, você vai trabalhar com um array chamado tweets. Ele contém o texto dos dados de sentimento de companhias aéreas coletados no Twitter.
Sua tarefa é trabalhar com esse array e transformá-lo em uma lista de tokens usando list comprehension. Depois disso, percorra a lista de tokens e crie o radical (stem) de cada token. Lembre-se de que list comprehensions são uma alternativa de uma linha aos laços for.
Este exercício faz parte do curso
Análise de Sentimentos em Python
Instruções do exercício
- Importe a função que usamos para transformar strings em radicais (stems).
- Chame a função de stemmer de Porter que você acabou de importar.
- Usando uma list comprehension, crie a lista
tokens. Ela deve conter todos os tokens de palavras do arraytweets. - Percorra a lista
tokense aplique a função de stemming a cada item da lista.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the function to perform stemming
____
from nltk import word_tokenize
# Call the stemmer
porter = ____()
# Transform the array of tweets to tokens
tokens = [____]
# Stem the list of tokens
stemmed_tokens = [[____.____(word) for word in tweet] for tweet in tokens]
# Print the first element of the list
print(stemmed_tokens[0])