Text mit BoW in Zahlen umwandeln
Nachdem du aus den Kundenrezensionen ein Vokabular erstellt hast, kannst du nun jede Rezension mit dem Bag-of-Words-(BoW)-Modell in ein numerisches Format umwandeln. Dieser Schritt erzeugt eine strukturierte Matrix, in der jede Zeile eine Rezension darstellt und jede Spalte einem Wort aus dem Vokabular entspricht.
Die Liste cleaned_reviews und der angepasste vectorizer sind bereits für dich geladen.
Diese Übung ist Teil des Kurses
<Kurs>Natural Language Processing (NLP) in Python</Kurs>Übungsanweisungen
- Wandle die
cleaned_reviewsin einebow_matrixum. - Gib die BoW-Darstellung als NumPy-Array aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Transform the reviews
bow_matrix = vectorizer.____(____)
# Print the BoW representation
print(____.____())