CommencerCommencer gratuitement

Convertir du texte en chiffres avec BoW

Maintenant que vous avez constitué un vocabulaire à partir des avis clients, vous êtes prêt à transformer chaque avis en un format numérique à l'aide du modèle Bag-of-Words (BoW). Cette étape permet de créer une matrice structurée où chaque ligne représente une évaluation et chaque colonne correspond à un mot du vocabulaire.

cleaned_reviews La liste des éléments d'vectorizer, ainsi que les adaptées, sont préchargées pour vous.

Cet exercice fait partie du cours

Traitement du langage naturel (NLP) en Python

Afficher le cours

Instructions

  • Transformez l'cleaned_reviews en un bow_matrix.
  • Imprimez la représentation BoW sous forme de tableau NumPy.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Transform the reviews
bow_matrix = vectorizer.____(____)

# Print the BoW representation
print(____.____())
Modifier et exécuter le code