Convertir du texte en chiffres avec BoW
Maintenant que vous avez constitué un vocabulaire à partir des avis clients, vous êtes prêt à transformer chaque avis en un format numérique à l'aide du modèle Bag-of-Words (BoW). Cette étape permet de créer une matrice structurée où chaque ligne représente une évaluation et chaque colonne correspond à un mot du vocabulaire.
cleaned_reviews
La liste des éléments d'vectorizer
, ainsi que les adaptées, sont préchargées pour vous.
Cet exercice fait partie du cours
Traitement du langage naturel (NLP) en Python
Instructions
- Transformez l'
cleaned_reviews
en unbow_matrix
. - Imprimez la représentation BoW sous forme de tableau NumPy.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Transform the reviews
bow_matrix = vectorizer.____(____)
# Print the BoW representation
print(____.____())