Inconsistenties herkennen
In de video-oefening leerde je over verschillende soorten inconsistenties die binnen categorieën kunnen optreden, waardoor het lijkt alsof een variabele meer categorieën heeft dan zou moeten.
In deze oefening ga je verder met de gegevensset sfo_survey. Je bekijkt opnieuw de kolom dest_size en ook de kolom cleanliness, en bepaalt met welke soort problemen, als die er zijn, deze twee categorische variabelen te maken hebben.
dplyr is geladen en sfo_survey is beschikbaar.
Deze oefening maakt deel uit van de cursus
Data opschonen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Count dest_size
sfo_survey %>%
___