Data over airline-tweets
De data frame twitter_data bevat meer dan 7.000 tweets over luchtvaartmaatschappijen. De tweets zijn al geclassificeerd als klacht of geen klacht in de kolom complaint_label. Laten we eens kijken hoeveel van deze tweets klachten zijn.
Houd er rekening mee dat dit echte data van Twitter is en dat er dus altijd een kans is dat er grof taalgebruik of andere aanstootgevende inhoud in voorkomt (in deze oefening en in eventuele volgende oefeningen die ook echte Twitter-data gebruiken).
Deze oefening maakt deel uit van de cursus
Introductie tot tekstanalyse in R
Oefeninstructies
- Laad het pakket
tidyverse. - Krijg een gevoel voor de grootte en inhoud van de data door
twitter_dataaf te drukken. - Filter
twitter_datazodat je alleen de klachten overhoudt. Hoeveel klachten staan er in de data?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the tidyverse packages
___(___)
# Print twitter_data
___
# Print just the complaints in twitter_data
twitter_data %>%
___(___ == ___)