Nach Produkt zählen und neu anordnen
tidy_twitter wurde tokenisiert, und Stoppwörter (inklusive benutzerdefinierter Stoppwörter) wurden entfernt. Du möchtest die Unterschiede in den Worthäufigkeiten zwischen Beschwerden und Nicht-Beschwerden visualisieren.
Diese Übung ist Teil des Kurses
Einführung in die Textanalyse mit R
Anleitung zur Übung
- Zähle Wörter danach, ob es sich um eine Beschwerde handelt oder nicht.
- Behalte die Top 20 Wörter je nachdem, ob es eine Beschwerde ist oder nicht.
- Hebe die Gruppierung auf, bevor du
wordals Faktor nach der Häufigkeit neu anordnest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
word_counts <- tidy_twitter %>%
# Count words by whether or not its a complaint
___(___, ___) %>%
# Group by whether or not its a complaint
group_by(___) %>%
# Keep the top 20 words
___(___, ___) %>%
# Ungroup before reordering word as a factor by the count
___() %>%
___(word2 = ___(___, ___))