CommencerCommencer gratuitement

Plus d’opérateurs de chaînes et Twitter

Dans cet exercice, vous allez appliquer différents opérateurs de chaînes à trois chaînes de caractères, sélectionnées dans le jeu de données tweets. Une liste tweets_list a été créée pour vous.

Vous devez construire trois nouvelles listes en appliquant différents opérateurs de chaînes :

  • une liste ne conservant que les lettres
  • une liste ne conservant que les caractères alphanumériques
  • une liste ne conservant que les chiffres

Les fonctions nécessaires ont été importées pour vous depuis nltk.

Cet exercice fait partie du cours

Analyse de sentiments en Python

Afficher le cours

Instructions

  • Créez une liste des jetons à partir de tweets_list.
  • Dans la liste letters, supprimez tous les chiffres et autres caractères, c’est-à-dire ne conservez que les lettres.
  • Conservez les caractères alphanumériques mais supprimez tous les autres caractères dans let_digits.
  • Créez digits en supprimant lettres et autres caractères pour ne garder que les nombres.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]

# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]

# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])
Modifier et exécuter le code