Ruggengraatafbeelding
De aggregatieplot die je in de vorige oefening hebt gemaakt, gaf je een globaal overzicht van de ontbrekende data. Als je geïnteresseerd bent in de interactie tussen specifieke variabelen, is een ruggengraatafbeelding (spine plot) de juiste keuze. Daarmee kun je het percentage ontbrekende waarden in de ene variabele bestuderen voor verschillende waarden van de andere, wat conceptueel sterk lijkt op de t-toetsen die je in de vorige les hebt uitgevoerd.
In deze oefening maak je een ruggengraatafbeelding om het percentage ontbrekende waarden in earnings te onderzoeken voor verschillende categorieën van sub_race. Is er voor sommige rassen van het hoofdpersonage van de film meer informatie over inkomsten ontbrekend? Laten we het uitzoeken! Het pakket VIM is alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Omgaan met missende data met imputaties in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Draw a spine plot to analyse missing values in earnings by sub_race
biopics %>%
select(___, ___) %>%
___()