CommencerCommencer gratuitement

Transformer du texte en nombres avec BoW

Vous avez maintenant construit un vocabulaire à partir des avis clients ; vous êtes prêt à transformer chaque avis en format numérique avec le modèle Bag-of-Words (BoW). Cette étape crée une matrice structurée où chaque ligne représente un avis et chaque colonne correspond à un mot du vocabulaire.

La liste cleaned_reviews et le vectorizer déjà ajusté sont préchargés pour vous.

Cet exercice fait partie du cours

Natural Language Processing (NLP) in Python

Afficher le cours

Instructions

  • Transformez les cleaned_reviews en une bow_matrix.
  • Affichez la représentation BoW sous forme de tableau NumPy.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Transform the reviews
bow_matrix = vectorizer.____(____)

# Print the BoW representation
print(____.____())
Modifier et exécuter le code