Aan de slagGa gratis aan de slag

Geen lid

Nu je hebt geoefend met het opsporen van problemen met lidmaatschapsrestricties, is het tijd om deze problemen in een nieuwe gegevensset op te lossen. In dit hoofdstuk werk je met een gegevensset genaamd sfo_survey, met enquêteresultaten van passagiers die vliegen vanaf San Francisco International Airport (SFO). Deelnemers kregen vragen over de netheid van de luchthaven, wachttijden, veiligheid en hun algehele tevredenheid.

Bij het verzamelen van de gegevens zijn een paar dingen misgegaan, waardoor er inconsistenties in de gegevensset zitten. In deze oefening werk je met de kolom dest_size, die de grootte aangeeft van de luchthaven van de eindbestemming waar de passagiers naartoe vlogen. Er is een data frame dest_sizes beschikbaar met alle mogelijke bestemmingsgroottes. Jouw missie is om rijen met ongeldige dest_size-waarden te vinden en ze uit het data frame te verwijderen.

dplyr is geladen en sfo_survey en dest_sizes zijn beschikbaar.

Deze oefening maakt deel uit van de cursus

Data opschonen in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Count the number of occurrences of dest_size
sfo_survey %>%
  count(___)
Code bewerken en uitvoeren