Erstelle die bessere Wortwolke
Nachdem du zusätzliche Stoppwörter entfernt hast, schauen wir uns die verbesserte Wortwolke an!
Die Term-Dokument-Matrix aus der vorherigen Übung wurde mit as.matrix() in eine Matrix umgewandelt, anschließend wurde mit rowSums() ein benannter Vektor erstellt. Dieses neue Objekt mit Termfrequenzen namens chardonnay_words ist in deinem Workspace vorab geladen. Lass uns die neuen Wortwolken-Ergebnisse ansehen.
Diese Übung ist Teil des Kurses
Text Mining mit Bag-of-Words in R
Anleitung zur Übung
Wir haben das Paket wordcloud im Hintergrund für dich geladen und werden das auch für alle weiteren Übungen tun, die es benötigen.
- Sortiere die Werte in
chardonnay_wordsmitdecreasing = TRUE. Speichere das Ergebnis alssorted_chardonnay_words. - Sieh dir die obersten 6 Wörter in
sorted_chardonnay_wordsund ihre Werte an. - Erstelle
terms_vec, indem dunames()aufchardonnay_wordsanwendest. - Übergebe
terms_vecundchardonnay_wordsan die Funktionwordcloud(). Prüfe, welche anderen Wörter jetzt auffallen, nachdem "chardonnay" entfernt wurde.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Sort the chardonnay_words in descending order
___ <- ___(___, ___)
# Print the 6 most frequent chardonnay terms
___(___)
# Get a terms vector
___ <- ___(___)
# Create a wordcloud for the values in word_freqs
wordcloud(___, ___,
max.words = 50, colors = "red")