Gebruikerstypen tellen
Tellingen zijn de belangrijkste samenvatting voor categorische gegevens. Omdat tekst categorisch is, is het belangrijk dat je gewend raakt aan het berekenen van tellingen. De twitter_data bestaat uit klachten en niet-klachten, zoals aangeduid door de kolom complaint_label, en bevat ook een kolom die aangeeft of de gebruiker geverifieerd is (dus door Twitter bevestigd is wie ze zeggen te zijn), genaamd usr_verified. Let op: die kolom is van het type <lgl>, oftewel logisch. Klagen geverifieerde gebruikers meer?
Deze oefening maakt deel uit van de cursus
Introductie tot tekstanalyse in R
Oefeninstructies
- Laad het pakket
tidyverse, datdplyrenggplot2bevat. - Filter de data zodat je alleen tweets overhoudt die klachten zijn.
- Tel het aantal geverifieerde en niet-geverifieerde gebruikers dat heeft geklaagd.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the tidyverse package
___(___)
twitter_data %>%
# Filter for just the complaints
___(___) %>%
# Count the number of verified and non-verified users
___(___)