Imputaties beoordelen: Over veel variabelen
Tot nu toe hebben we manieren besproken om naar afzonderlijke variabelen of paren van variabelen en hun geïmputeerde waarden te kijken. Soms wil je echter de imputaties voor veel variabelen tegelijk bekijken. Hiervoor moet je wat data munging en herindeling doen. Deze les laat zien hoe je die datatransformatie uitvoert, wat best pittig kan zijn in nabular data. De functie shadow_long() zet de data in de juiste vorm voor dit soort visualisaties.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
- Gebruik
shadow_long()om de geïmputeerde dataocean_imp_meante verzamelen, met focus ophumidityenair_temp_c. - Print de data en bekijk deze.
- Verken de imputaties in een histogram met
geom_histogram(), zet de waarden op de x-as, kleur op basis van hun missingness en facet opvariable.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Gather the imputed data
ocean_imp_mean_gather <- shadow_long(___,
___,
___))
# Inspect the data
___
# Explore the imputations in a histogram
ggplot(ocean_imp_mean_gather,
aes(x = value, fill = value_NA)) +
geom_histogram() +
facet_wrap(~variable)