Spécifier le motif des jetons

Dans cet exercice, vous allez travailler avec la colonne text du jeu de données tweets. Votre tâche consiste à vectoriser cette colonne d’objets à l’aide de CountVectorizer. Vous appliquerez différents motifs de jetons dans le vectoriseur. Rappelez-vous qu’en spécifiant le motif des jetons, vous pouvez filtrer certains caractères.

Le CountVectorizer a été importé pour vous.

Cet exercice fait partie du cours

<cours>Analyse de sentiments en Python</cours>

Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Build and fit the vectorizer
vect = ____(____=r'\b[^\d\W][^\d\W]+\b').fit(tweets.text)
vect.transform(tweets.text)
print('Length of vectorizer: ', len(vect.get_feature_names()))

Modifier et exécuter le code