Wortzählungen mit Faktoren visualisieren
Ich habe weitere benutzerdefinierte Stoppwörter (einschließlich der Flugliniennamen) hinzugefügt und die Daten für dich aufbereitet. Jetzt erstellst du eine verbesserte Visualisierung und plottest die Wörter in absteigender Reihenfolge nach Wortanzahl.
Diese Übung ist Teil des Kurses
Einführung in die Textanalyse mit R
Anleitung zur Übung
- Behalte nur die Begriffe, die in den
non_complaintsmehr als 100‑mal vorkommen. - Ordne die Spalte
wordals Faktor neu, sortiert nach Wortanzahlen. - Erstelle ein Balkendiagramm mit der neuen Wortspalte vom Typ Faktor.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
word_counts <- tidy_twitter %>%
filter(complaint_label == "Non-Complaint") %>%
count(word) %>%
# Keep terms that occur more than 100 times
___(___) %>%
# Reorder word as an ordered factor by word counts
___(word2 = ___(___, ___))
# Plot the new word column with type factor
___(___, aes(___, ___)) +
___() +
___() +
ggtitle("Non-Complaint Word Counts")