ComeçarComece de graça

Mais operadores de string e Twitter

Neste exercício, você vai aplicar diferentes operadores de string a três strings, selecionadas do conjunto de dados tweets. Uma tweets_list já foi criada para você.

Você precisa construir três novas listas aplicando diferentes operadores de string:

  • uma lista que mantenha apenas letras
  • uma lista que mantenha apenas caracteres
  • uma lista que mantenha apenas dígitos

As funções necessárias já foram importadas para você de nltk.

Este exercício faz parte do curso

Análise de Sentimentos em Python

Ver curso

Instruções do exercício

  • Crie uma lista com os tokens de tweets_list.
  • Na lista letters, remova todos os dígitos e outros caracteres; ou seja, mantenha apenas letras.
  • Mantenha caracteres alfanuméricos, mas remova todos os outros caracteres em let_digits.
  • Crie digits removendo letras e caracteres e mantendo apenas números.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]

# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]

# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])
Editar e executar o código