CommencerCommencer gratuitement

Enrichir son vocabulaire à partir des avis clients

Vous faites partie d'une équipe d'analyse de produits chez TechZone, une entreprise spécialisée dans l'électronique grand public. Vous avez reçu quelques avis clients concernant un nouveau gadget. Pour analyser les avis, vous devez d'abord prétraiter le texte et créer un vocabulaire, une liste de mots uniques qui définit les caractéristiques utilisées pour représenter chaque avis sous forme de données numériques.

Une fonction d'preprocess() est préchargée pour vous. Il convertit le texte en minuscules, le tokenise et supprime la ponctuation.

Cet exercice fait partie du cours

Traitement du langage naturel (NLP) en Python

Afficher le cours

Instructions

  • Pré-traitez chaque avis du jeu de données à l'aide de la fonction « preprocess() ».
  • Ajustez l'vectorizer e aux avis prétraités.
  • Veuillez imprimer le vocabulaire obtenu.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

reviews = [
    "The product is fantastic! It works like a charm.",
    "I hated the product. It broke after one use.",
    "Product was okay, not the best, but fine overall."
]
# Preprocess the reviews
cleaned_reviews = [____ for ____ in ____]

vectorizer = CountVectorizer()
# Fit the vectorizer
vectorizer.____
# Print the vocabulary 
print(vectorizer.____)
Modifier et exécuter le code