Eine einfache Wordcloud
An diesem Punkt hattest du eindeutig zu viel Kaffee. Außerdem sind Top-Wörter wie „shop“, „morning“ und „drinking“ nicht besonders aufschlussreich.
Zur Feier, dass du es bis hierhin geschafft hast, probieren wir es mit einer weiteren Sammlung von 1000 Tweets. Du weißt jetzt noch nicht, was sie gemeinsam haben, aber vielleicht findest du es mit einer Wordcloud heraus. Die Termfrequenzen der Tweets sind in deiner Arbeitsumgebung bereits geladen.
Eine Wordcloud ist eine Visualisierung von Begriffen. In einer Wordcloud ist die Größe oft an die Häufigkeit gekoppelt, und in manchen Fällen zeigen Farben eine weitere Kennzahl an. Wir halten es jetzt einfach: Die Größe entspricht der Häufigkeit einzelner Wörter, und wir verwenden nur eine einzige Farbe.
Wie du im Video gesehen hast, funktioniert die Funktion wordcloud() so:
wordcloud(words, frequencies, max.words = 500, colors = "blue")
Text-Mining-Analysen enthalten oft einfache Wordclouds. Sie sind wahrscheinlich überstrapaziert, können aber trotzdem helfen, schnell ein Textkorpus zu verstehen!
term_frequency ist in deine Arbeitsumgebung geladen.
Diese Übung ist Teil des Kurses
Text Mining mit Bag-of-Words in R
Anleitung zur Übung
- Lade das Paket
wordcloud. - Gib die ersten 10 Einträge in
term_frequencyaus. - Extrahiere die Terme mit
names()aufterm_frequency. Nenne den String-Vektorterms_vec. - Erstelle eine
wordcloud()mitterms_vecals Wörter undterm_frequencyals Werten. Füge die Parametermax.words = 50undcolors = "red"hinzu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load wordcloud package
# Print the first 10 entries in term_frequency
# Vector of terms
# Create a word cloud for the values in word_freqs