Enrichir son vocabulaire à partir des avis clients
Vous faites partie d'une équipe d'analyse de produits chez TechZone, une entreprise spécialisée dans l'électronique grand public. Vous avez reçu quelques avis clients concernant un nouveau gadget. Pour analyser les avis, vous devez d'abord prétraiter le texte et créer un vocabulaire, une liste de mots uniques qui définit les caractéristiques utilisées pour représenter chaque avis sous forme de données numériques.
Une fonction d'preprocess()
est préchargée pour vous. Il convertit le texte en minuscules, le tokenise et supprime la ponctuation.
Cet exercice fait partie du cours
Traitement du langage naturel (NLP) en Python
Instructions
- Pré-traitez chaque avis du jeu de données à l'aide de la fonction «
preprocess()
». - Ajustez l'
vectorizer
e aux avis prétraités. - Veuillez imprimer le vocabulaire obtenu.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
reviews = [
"The product is fantastic! It works like a charm.",
"I hated the product. It broke after one use.",
"Product was okay, not the best, but fine overall."
]
# Preprocess the reviews
cleaned_reviews = [____ for ____ in ____]
vectorizer = CountVectorizer()
# Fit the vectorizer
vectorizer.____
# Print the vocabulary
print(vectorizer.____)