LoslegenKostenlos starten

Text mit BoW in Zahlen umwandeln

Nachdem du aus den Kundenrezensionen ein Vokabular erstellt hast, kannst du nun jede Rezension mit dem Bag-of-Words-(BoW)-Modell in ein numerisches Format umwandeln. Dieser Schritt erzeugt eine strukturierte Matrix, in der jede Zeile eine Rezension darstellt und jede Spalte einem Wort aus dem Vokabular entspricht.

Die Liste cleaned_reviews und der angepasste vectorizer sind bereits für dich geladen.

Diese Übung ist Teil des Kurses

<Kurs>Natural Language Processing (NLP) in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Wandle die cleaned_reviews in eine bow_matrix um.
  • Gib die BoW-Darstellung als NumPy-Array aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Transform the reviews
bow_matrix = vectorizer.____(____)

# Print the BoW representation
print(____.____())
Code bearbeiten und ausführen