Vokabeln aus Kundenbewertungen lernen
Du bist Teil eines Produktanalyse-Teams bei TechZone, einem Unternehmen für Unterhaltungselektronik. Du hast ein paar Kundenbewertungen für ein neues Gadget bekommen. Um die Bewertungen zu analysieren, musst du zuerst den Text aufbereiten und ein Vokabular erstellen, also eine Liste mit einzigartigen Wörtern, die die Merkmale definieren, mit denen jede Bewertung als Zahlen dargestellt wird.
Die Funktion „ preprocess()
“ ist schon für dich vorbereitet. Der Text wird in Kleinbuchstaben umgewandelt, in Tokens aufgeteilt und Interpunktion wird entfernt.
Diese Übung ist Teil des Kurses
Natürliche Sprachverarbeitung (NLP) in Python
Anleitung zur Übung
- Bearbeite jede Bewertung im Datensatz mit der Funktion „
preprocess()
“. - Pass das „
vectorizer
” auf die vorbereiteten Bewertungen an. - Druck das resultierende Vokabular aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
reviews = [
"The product is fantastic! It works like a charm.",
"I hated the product. It broke after one use.",
"Product was okay, not the best, but fine overall."
]
# Preprocess the reviews
cleaned_reviews = [____ for ____ in ____]
vectorizer = CountVectorizer()
# Fit the vectorizer
vectorizer.____
# Print the vocabulary
print(vectorizer.____)