LoslegenKostenlos loslegen

Vokabeln aus Kundenbewertungen lernen

Du bist Teil eines Produktanalyse-Teams bei TechZone, einem Unternehmen für Unterhaltungselektronik. Du hast ein paar Kundenbewertungen für ein neues Gadget bekommen. Um die Bewertungen zu analysieren, musst du zuerst den Text aufbereiten und ein Vokabular erstellen, also eine Liste mit einzigartigen Wörtern, die die Merkmale definieren, mit denen jede Bewertung als Zahlen dargestellt wird.

Die Funktion „ preprocess() “ ist schon für dich vorbereitet. Der Text wird in Kleinbuchstaben umgewandelt, in Tokens aufgeteilt und Interpunktion wird entfernt.

Diese Übung ist Teil des Kurses

Natürliche Sprachverarbeitung (NLP) in Python

Kurs anzeigen

Anleitung zur Übung

  • Bearbeite jede Bewertung im Datensatz mit der Funktion „ preprocess() “.
  • Pass das „ vectorizer ” auf die vorbereiteten Bewertungen an.
  • Druck das resultierende Vokabular aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

reviews = [
    "The product is fantastic! It works like a charm.",
    "I hated the product. It broke after one use.",
    "Product was okay, not the best, but fine overall."
]
# Preprocess the reviews
cleaned_reviews = [____ for ____ in ____]

vectorizer = CountVectorizer()
# Fit the vectorizer
vectorizer.____
# Print the vocabulary 
print(vectorizer.____)
Code bearbeiten und ausführen