Aan de slagGa gratis aan de slag

Imputaties beoordelen: Over veel variabelen

Tot nu toe hebben we manieren besproken om naar afzonderlijke variabelen of paren van variabelen en hun geïmputeerde waarden te kijken. Soms wil je echter de imputaties voor veel variabelen tegelijk bekijken. Hiervoor moet je wat data munging en herindeling doen. Deze les laat zien hoe je die datatransformatie uitvoert, wat best pittig kan zijn in nabular data. De functie shadow_long() zet de data in de juiste vorm voor dit soort visualisaties.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in R

Cursus bekijken

Oefeninstructies

  • Gebruik shadow_long() om de geïmputeerde data ocean_imp_mean te verzamelen, met focus op humidity en air_temp_c.
  • Print de data en bekijk deze.
  • Verken de imputaties in een histogram met geom_histogram(), zet de waarden op de x-as, kleur op basis van hun missingness en facet op variable.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Gather the imputed data 
ocean_imp_mean_gather <- shadow_long(___,
                                     ___,
                                     ___))
# Inspect the data
___

# Explore the imputations in a histogram 
ggplot(ocean_imp_mean_gather, 
       aes(x = value, fill = value_NA)) + 
  geom_histogram() + 
  facet_wrap(~variable)
Code bewerken en uitvoeren