Nabulaire data en samenvatten op ontbrekendheid
In deze oefening ga je bekijken hoe je nabular-data kunt gebruiken om de variatie in een variabele te onderzoeken op basis van de ontbrekendheid van een andere.
We gebruiken de oceanbuoys-gegevensset uit naniar en maken vervolgens meerdere plots van de data met facetten.
Zo kun je verschillende lagen van ontbrekendheid verkennen.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
- Onderzoek de verdeling van wind oost-west (
wind_ew) voor de ontbrekendheid van de luchttemperatuur metgeom_density()en facet op de ontbrekendheid van de luchttemperatuur (air_temp_c_NA). - Breid deze visualisatie uit door te vullen op basis van de ontbrekendheid van de luchtvochtigheid (
humidity_NA).
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Explore the distribution of wind east west (wind_ew) for the missingness of air temperature
# using geom_density() and faceting by the missingness of air temperature (air_temp_c_NA).
___ %>%
bind_shadow(___) %>%
ggplot(aes(x = ___)) +
geom_density() +
facet_wrap(~___)
# Build upon this visualization by coloring by the missingness of humidity (humidity_NA).
___ %>%
___(___) %>%
ggplot(aes(x = ___,
color = ___)) +
geom_density() +
___(~___)