CommencerCommencez gratuitement

Transformer du texte en nombres avec BoW

Vous avez maintenant construit un vocabulaire à partir des avis clients ; vous êtes prêt à transformer chaque avis en format numérique avec le modèle Bag-of-Words (BoW). Cette étape crée une matrice structurée où chaque ligne représente un avis et chaque colonne correspond à un mot du vocabulaire.

La liste cleaned_reviews et le vectorizer déjà ajusté sont préchargés pour vous.

Cet exercice fait partie du cours

<cours>Natural Language Processing (NLP) in Python</cours>
Voir le cours

Instructions de l’exercice

  • Transformez les cleaned_reviews en une bow_matrix.
  • Affichez la représentation BoW sous forme de tableau NumPy.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Transform the reviews
bow_matrix = vectorizer.____(____)

# Print the BoW representation
print(____.____())
Modifier et exécuter le code