Aan de slagGa gratis aan de slag

Woordaantallen visualiseren met factors

Ik heb een aantal extra aangepaste stopwoorden (inclusief de namen van luchtvaartmaatschappijen) toegevoegd en de data alvast voor je opgeschoond. Nu ga je een verbeterde visualisatie maken en de woorden plotten in aflopende volgorde op basis van hun aantal.

Deze oefening maakt deel uit van de cursus

Introductie tot tekstanalyse in R

Cursus bekijken

Oefeninstructies

  • Houd alleen de termen over die meer dan 100 keer voorkomen in non_complaints.
  • Herorden de kolom word als een factor, geordend op woordaantallen.
  • Maak een staafdiagram met de nieuwe woordkolom van het type factor.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

word_counts <- tidy_twitter %>% 
  filter(complaint_label == "Non-Complaint") %>% 
  count(word) %>% 
  # Keep terms that occur more than 100 times
  ___(___) %>% 
  # Reorder word as an ordered factor by word counts
  ___(word2 = ___(___, ___))

# Plot the new word column with type factor
___(___, aes(___, ___)) +
  ___() +
  ___() +
  ggtitle("Non-Complaint Word Counts")
Code bewerken en uitvoeren