Maak een histogram van geïmputeerde data
Nu we de eerste visualisatie van geom_miss_point() kunnen namaken, gaan we bekijken hoe we dit kunnen toepassen op andere verkennende taken.
Een nuttige taak is het evalueren van het aantal ontbrekende waarden in een bepaalde variabele met een histogram. Dit kunnen we doen met de gegevensset ocean_imp_track die we in de vorige oefening hebben gemaakt en die in deze sessie is geladen.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
Gebruik de geïmputeerde en bijgehouden data, ocean_imp_track:
- Verken de waarden van
air_temp_cen visualiseer het aantal missings metair_temp_c_NA. - Verken de missings in
humiditymethumidity_NA. - Verken de missings in
air_temp_cper jaar metfacet_wrap(~year). - Verken de missings in
humidityper jaar metfacet_wrap(~year).
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Explore the values of air_temp_c, visualizing the amount of missings with `air_temp_c_NA`.
p <- ggplot(___, aes(x = ___, fill = ___)) + ___()
# Expore the missings in humidity using humidity_NA
p2 <- ggplot(___, aes(x = ___, fill = ___)) + ___()
# Explore the missings in air_temp_c according to year, using `facet_wrap(~year)`.
p + facet_wrap(~___)
# Explore the missings in humidity according to year, using `facet_wrap(~year)`.
p2 + facet_wrap(~___)