Aan de slagBegin gratis

Inconsistenties herkennen

In de video-oefening leerde je over verschillende soorten inconsistenties die binnen categorieën kunnen optreden, waardoor het lijkt alsof een variabele meer categorieën heeft dan zou moeten.

In deze oefening ga je verder met de gegevensset sfo_survey. Je bekijkt opnieuw de kolom dest_size en ook de kolom cleanliness, en bepaalt met welke soort problemen, als die er zijn, deze twee categorische variabelen te maken hebben.

dplyr is geladen en sfo_survey is beschikbaar.

Deze oefening maakt deel uit van de cursus

Data opschonen in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Count dest_size
sfo_survey %>%
  ___
Code bewerken en uitvoeren