CommencerCommencez gratuitement

Plus d’opérateurs de chaînes et Twitter

Dans cet exercice, vous allez appliquer différents opérateurs de chaînes à trois chaînes de caractères, sélectionnées dans le jeu de données tweets. Une liste tweets_list a été créée pour vous.

Vous devez construire trois nouvelles listes en appliquant différents opérateurs de chaînes :

  • une liste ne conservant que les lettres
  • une liste ne conservant que les caractères alphanumériques
  • une liste ne conservant que les chiffres

Les fonctions nécessaires ont été importées pour vous depuis nltk.

Cet exercice fait partie du cours

<cours>Analyse de sentiments en Python</cours>
Voir le cours

Instructions de l’exercice

  • Créez une liste des jetons à partir de tweets_list.
  • Dans la liste letters, supprimez tous les chiffres et autres caractères, c’est-à-dire ne conservez que les lettres.
  • Conservez les caractères alphanumériques mais supprimez tous les autres caractères dans let_digits.
  • Créez digits en supprimant lettres et autres caractères pour ne garder que les nombres.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]

# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]

# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])
Modifier et exécuter le code