Text mit BoW in Zahlen umwandeln
Nachdem du aus den Kundenrezensionen ein Vokabular erstellt hast, kannst du nun jede Rezension mit dem Bag-of-Words-(BoW)-Modell in ein numerisches Format umwandeln. Dieser Schritt erzeugt eine strukturierte Matrix, in der jede Zeile eine Rezension darstellt und jede Spalte einem Wort aus dem Vokabular entspricht.
Die Liste cleaned_reviews und der angepasste vectorizer sind bereits für dich geladen.
Diese Übung ist Teil des Kurses
Natural Language Processing (NLP) in Python
Anleitung zur Übung
- Wandle die
cleaned_reviewsin einebow_matrixum. - Gib die BoW-Darstellung als NumPy-Array aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Transform the reviews
bow_matrix = vectorizer.____(____)
# Print the BoW representation
print(____.____())