LoslegenKostenlos loslegen

Text mit BoW in Zahlen umwandeln

Nachdem du aus den Kundenrezensionen ein Vokabular erstellt hast, kannst du nun jede Rezension mit dem Bag-of-Words-(BoW)-Modell in ein numerisches Format umwandeln. Dieser Schritt erzeugt eine strukturierte Matrix, in der jede Zeile eine Rezension darstellt und jede Spalte einem Wort aus dem Vokabular entspricht.

Die Liste cleaned_reviews und der angepasste vectorizer sind bereits für dich geladen.

Diese Übung ist Teil des Kurses

Natural Language Processing (NLP) in Python

Kurs anzeigen

Anleitung zur Übung

  • Wandle die cleaned_reviews in eine bow_matrix um.
  • Gib die BoW-Darstellung als NumPy-Array aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Transform the reviews
bow_matrix = vectorizer.____(____)

# Print the BoW representation
print(____.____())
Code bearbeiten und ausführen