Plus d’opérateurs de chaînes et Twitter
Dans cet exercice, vous allez appliquer différents opérateurs de chaînes à trois chaînes de caractères, sélectionnées dans le jeu de données tweets. Une liste tweets_list a été créée pour vous.
Vous devez construire trois nouvelles listes en appliquant différents opérateurs de chaînes :
- une liste ne conservant que les lettres
- une liste ne conservant que les caractères alphanumériques
- une liste ne conservant que les chiffres
Les fonctions nécessaires ont été importées pour vous depuis nltk.
Cet exercice fait partie du cours
Analyse de sentiments en Python
Instructions
- Créez une liste des jetons à partir de
tweets_list. - Dans la liste
letters, supprimez tous les chiffres et autres caractères, c’est-à-dire ne conservez que les lettres. - Conservez les caractères alphanumériques mais supprimez tous les autres caractères dans
let_digits. - Créez
digitsen supprimant lettres et autres caractères pour ne garder que les nombres.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]
# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]
# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])