Aan de slagGa gratis aan de slag

Data over airline-tweets

De data frame twitter_data bevat meer dan 7.000 tweets over luchtvaartmaatschappijen. De tweets zijn al geclassificeerd als klacht of geen klacht in de kolom complaint_label. Laten we eens kijken hoeveel van deze tweets klachten zijn.

Houd er rekening mee dat dit echte data van Twitter is en dat er dus altijd een kans is dat er grof taalgebruik of andere aanstootgevende inhoud in voorkomt (in deze oefening en in eventuele volgende oefeningen die ook echte Twitter-data gebruiken).

Deze oefening maakt deel uit van de cursus

Introductie tot tekstanalyse in R

Cursus bekijken

Oefeninstructies

  • Laad het pakket tidyverse.
  • Krijg een gevoel voor de grootte en inhoud van de data door twitter_data af te drukken.
  • Filter twitter_data zodat je alleen de klachten overhoudt. Hoeveel klachten staan er in de data?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load the tidyverse packages
___(___)

# Print twitter_data
___

# Print just the complaints in twitter_data
twitter_data %>% 
  ___(___ == ___)
Code bewerken en uitvoeren