Aan de slagBegin gratis

Woordaantallen visualiseren met factors

Ik heb een aantal extra aangepaste stopwoorden (inclusief de namen van luchtvaartmaatschappijen) toegevoegd en de data alvast voor je opgeschoond. Nu ga je een verbeterde visualisatie maken en de woorden plotten in aflopende volgorde op basis van hun aantal.

Deze oefening maakt deel uit van de cursus

Introductie tot tekstanalyse in R

Bekijk cursus

Oefeninstructies

  • Houd alleen de termen over die meer dan 100 keer voorkomen in non_complaints.
  • Herorden de kolom word als een factor, geordend op woordaantallen.
  • Maak een staafdiagram met de nieuwe woordkolom van het type factor.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

word_counts <- tidy_twitter %>% 
  filter(complaint_label == "Non-Complaint") %>% 
  count(word) %>% 
  # Keep terms that occur more than 100 times
  ___(___) %>% 
  # Reorder word as an ordered factor by word counts
  ___(word2 = ___(___, ___))

# Plot the new word column with type factor
___(___, aes(___, ___)) +
  ___() +
  ___() +
  ggtitle("Non-Complaint Word Counts")
Code bewerken en uitvoeren