Erstelle die bessere Wortwolke

Nachdem du zusätzliche Stoppwörter entfernt hast, schauen wir uns die verbesserte Wortwolke an!

Die Term-Dokument-Matrix aus der vorherigen Übung wurde mit as.matrix() in eine Matrix umgewandelt, anschließend wurde mit rowSums() ein benannter Vektor erstellt. Dieses neue Objekt mit Termfrequenzen namens chardonnay_words ist in deinem Workspace vorab geladen. Lass uns die neuen Wortwolken-Ergebnisse ansehen.

Diese Übung ist Teil des Kurses

<Kurs>Text Mining mit Bag-of-Words in R</Kurs>

Kurs ansehen

Übungsanweisungen

Wir haben das Paket wordcloud im Hintergrund für dich geladen und werden das auch für alle weiteren Übungen tun, die es benötigen.

Sortiere die Werte in chardonnay_words mit decreasing = TRUE. Speichere das Ergebnis als sorted_chardonnay_words.
Sieh dir die obersten 6 Wörter in sorted_chardonnay_words und ihre Werte an.
Erstelle terms_vec, indem du names() auf chardonnay_words anwendest.
Übergebe terms_vec und chardonnay_words an die Funktion wordcloud(). Prüfe, welche anderen Wörter jetzt auffallen, nachdem "chardonnay" entfernt wurde.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Sort the chardonnay_words in descending order
___ <- ___(___, ___)

# Print the 6 most frequent chardonnay terms
___(___)

# Get a terms vector
___ <- ___(___)

# Create a wordcloud for the values in word_freqs
wordcloud(___, ___, 
          max.words = 50, colors = "red")

Code bearbeiten und ausführen