Nabular data en vullen op basis van ontbrekendheid
Samenvattingsstatistieken zijn nuttig om te berekenen, maar zoals ze zeggen: een plaatje zegt meer dan duizend woorden.
In deze oefening ga je verkennen hoe je nabular-data kunt gebruiken om de variatie in een variabele te onderzoeken op basis van het ontbrekend-zijn van een andere variabele.
We gebruiken de oceanbuoys-gegevensset uit naniar.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
- Verken eerst de structuur van ontbrekende waarden in
oceanbuoysmetvis_miss(). - Verken de verdeling van wind oost-west (
wind_ew) voor het ontbrekend-zijn van luchttemperatuur metgeom_density(). - Verken de verdeling van zeetemperatuur voor het ontbrekend-zijn van luchtvochtigheid met
geom_density().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# First explore the missingness structure of `oceanbuoys` using `vis_miss()`
vis_miss(___)
# Explore the distribution of `wind_ew` for the missingness
# of `air_temp_c_NA` using `geom_density()`
bind_shadow(oceanbuoys) %>%
ggplot(aes(x = ___,
color = air_temp_c_NA)) +
geom_density()
# Explore the distribution of sea temperature for the
# missingness of humidity (humidity_NA) using `geom_density()`
___(___) %>%
ggplot(aes(x = ___,
color = ___)) +
geom_density()