Transformer du texte en nombres avec BoW
Vous avez maintenant construit un vocabulaire à partir des avis clients ; vous êtes prêt à transformer chaque avis en format numérique avec le modèle Bag-of-Words (BoW). Cette étape crée une matrice structurée où chaque ligne représente un avis et chaque colonne correspond à un mot du vocabulaire.
La liste cleaned_reviews et le vectorizer déjà ajusté sont préchargés pour vous.
Cet exercice fait partie du cours
Natural Language Processing (NLP) in Python
Instructions
- Transformez les
cleaned_reviewsen unebow_matrix. - Affichez la représentation BoW sous forme de tableau NumPy.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Transform the reviews
bow_matrix = vectorizer.____(____)
# Print the BoW representation
print(____.____())