Spécifier le motif des jetons
Dans cet exercice, vous allez travailler avec la colonne text du jeu de données tweets. Votre tâche consiste à vectoriser cette colonne d’objets à l’aide de CountVectorizer. Vous appliquerez différents motifs de jetons dans le vectoriseur. Rappelez-vous qu’en spécifiant le motif des jetons, vous pouvez filtrer certains caractères.
Le CountVectorizer a été importé pour vous.
Cet exercice fait partie du cours
Analyse de sentiments en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Build and fit the vectorizer
vect = ____(____=r'\b[^\d\W][^\d\W]+\b').fit(tweets.text)
vect.transform(tweets.text)
print('Length of vectorizer: ', len(vect.get_feature_names()))