Beschwerden visualisieren
Wir haben das letzte Kapitel mit Worthäufigkeiten zu Beschwerden beendet. Jetzt visualisieren wir diese Zählwerte mit einem Balkendiagramm.
Die Pakete tidyverse und tidytext sind geladen. twitter_data wurde tokenisiert und die üblichen Stoppwörter wurden entfernt.
Diese Übung ist Teil des Kurses
Einführung in die Textanalyse mit R
Anleitung zur Übung
- Behalte nur die Wörter mit einer Häufigkeit größer als 100.
- Erstelle ein Balkendiagramm mit
word_counts, wobeiwordder x-Achse zugeordnet wird. - Drehe die Koordinaten der Grafik.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
word_counts <- tidy_twitter %>%
filter(complaint_label == "Complaint") %>%
count(word) %>%
# Keep words with count greater than 100
___(___)
# Create a bar plot using word_counts with x = word
ggplot(___, aes(___, ___)) +
geom_col() +
# Flip the plot coordinates
___()