Text mit BoW in Zahlen umwandeln
Jetzt, wo du aus den Kundenbewertungen ein Vokabular erstellt hast, kannst du jede Bewertung mit dem Bag-of-Words-Modell (BoW) in ein numerisches Format umwandeln. In diesem Schritt wird eine übersichtliche Matrix erstellt, in der jede Zeile eine Bewertung darstellt und jede Spalte einem Wort aus dem Vokabular entspricht.
Die Liste „ cleaned_reviews
“ und die angepasste Liste „ vectorizer
“ sind schon für dich geladen.
Diese Übung ist Teil des Kurses
Natürliche Sprachverarbeitung (NLP) in Python
Anleitung zur Übung
- Verwandle den „
cleaned_reviews
” in einen „bow_matrix
”. - Druck die BoW-Darstellung als NumPy-Array aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Transform the reviews
bow_matrix = vectorizer.____(____)
# Print the BoW representation
print(____.____())