Woordaantallen visualiseren met factors
Ik heb een aantal extra aangepaste stopwoorden (inclusief de namen van luchtvaartmaatschappijen) toegevoegd en de data alvast voor je opgeschoond. Nu ga je een verbeterde visualisatie maken en de woorden plotten in aflopende volgorde op basis van hun aantal.
Deze oefening maakt deel uit van de cursus
Introductie tot tekstanalyse in R
Oefeninstructies
- Houd alleen de termen over die meer dan 100 keer voorkomen in
non_complaints. - Herorden de kolom
wordals een factor, geordend op woordaantallen. - Maak een staafdiagram met de nieuwe woordkolom van het type factor.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
word_counts <- tidy_twitter %>%
filter(complaint_label == "Non-Complaint") %>%
count(word) %>%
# Keep terms that occur more than 100 times
___(___) %>%
# Reorder word as an ordered factor by word counts
___(word2 = ___(___, ___))
# Plot the new word column with type factor
___(___, aes(___, ___)) +
___() +
___() +
ggtitle("Non-Complaint Word Counts")