Aan de slagGa gratis aan de slag

Gebruikerstypen tellen

Tellingen zijn de belangrijkste samenvatting voor categorische gegevens. Omdat tekst categorisch is, is het belangrijk dat je gewend raakt aan het berekenen van tellingen. De twitter_data bestaat uit klachten en niet-klachten, zoals aangeduid door de kolom complaint_label, en bevat ook een kolom die aangeeft of de gebruiker geverifieerd is (dus door Twitter bevestigd is wie ze zeggen te zijn), genaamd usr_verified. Let op: die kolom is van het type <lgl>, oftewel logisch. Klagen geverifieerde gebruikers meer?

Deze oefening maakt deel uit van de cursus

Introductie tot tekstanalyse in R

Cursus bekijken

Oefeninstructies

  • Laad het pakket tidyverse, dat dplyr en ggplot2 bevat.
  • Filter de data zodat je alleen tweets overhoudt die klachten zijn.
  • Tel het aantal geverifieerde en niet-geverifieerde gebruikers dat heeft geklaagd.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load the tidyverse package
___(___)

twitter_data %>% 
  # Filter for just the complaints
  ___(___) %>% 
  # Count the number of verified and non-verified users
  ___(___)
Code bewerken en uitvoeren