Eine einfache Wordcloud

An diesem Punkt hattest du eindeutig zu viel Kaffee. Außerdem sind Top-Wörter wie „shop“, „morning“ und „drinking“ nicht besonders aufschlussreich.

Zur Feier, dass du es bis hierhin geschafft hast, probieren wir es mit einer weiteren Sammlung von 1000 Tweets. Du weißt jetzt noch nicht, was sie gemeinsam haben, aber vielleicht findest du es mit einer Wordcloud heraus. Die Termfrequenzen der Tweets sind in deiner Arbeitsumgebung bereits geladen.

Eine Wordcloud ist eine Visualisierung von Begriffen. In einer Wordcloud ist die Größe oft an die Häufigkeit gekoppelt, und in manchen Fällen zeigen Farben eine weitere Kennzahl an. Wir halten es jetzt einfach: Die Größe entspricht der Häufigkeit einzelner Wörter, und wir verwenden nur eine einzige Farbe.

Wie du im Video gesehen hast, funktioniert die Funktion wordcloud() so:

wordcloud(words, frequencies, max.words = 500, colors = "blue")

Text-Mining-Analysen enthalten oft einfache Wordclouds. Sie sind wahrscheinlich überstrapaziert, können aber trotzdem helfen, schnell ein Textkorpus zu verstehen!

term_frequency ist in deine Arbeitsumgebung geladen.

Diese Übung ist Teil des Kurses

<Kurs>Text Mining mit Bag-of-Words in R</Kurs>

Kurs ansehen

Übungsanweisungen

Lade das Paket wordcloud.
Gib die ersten 10 Einträge in term_frequency aus.
Extrahiere die Terme mit names() auf term_frequency. Nenne den String-Vektor terms_vec.
Erstelle eine wordcloud() mit terms_vec als Wörter und term_frequency als Werten. Füge die Parameter max.words = 50 und colors = "red" hinzu.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Load wordcloud package


# Print the first 10 entries in term_frequency


# Vector of terms


# Create a word cloud for the values in word_freqs

Code bearbeiten und ausführen