Mais operadores de string e Twitter
Neste exercício, você vai aplicar diferentes operadores de string a três strings, selecionadas do conjunto de dados tweets. Uma tweets_list já foi criada para você.
Você precisa construir três novas listas aplicando diferentes operadores de string:
- uma lista que mantenha apenas letras
- uma lista que mantenha apenas caracteres
- uma lista que mantenha apenas dígitos
As funções necessárias já foram importadas para você de nltk.
Este exercício faz parte do curso
Análise de Sentimentos em Python
Instruções do exercício
- Crie uma lista com os tokens de
tweets_list. - Na lista
letters, remova todos os dígitos e outros caracteres; ou seja, mantenha apenas letras. - Mantenha caracteres alfanuméricos, mas remova todos os outros caracteres em
let_digits. - Crie
digitsremovendo letras e caracteres e mantendo apenas números.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]
# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]
# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])