Aan de slagGa gratis aan de slag

Nabular data en vullen op basis van ontbrekendheid

Samenvattingsstatistieken zijn nuttig om te berekenen, maar zoals ze zeggen: een plaatje zegt meer dan duizend woorden.

In deze oefening ga je verkennen hoe je nabular-data kunt gebruiken om de variatie in een variabele te onderzoeken op basis van het ontbrekend-zijn van een andere variabele.

We gebruiken de oceanbuoys-gegevensset uit naniar.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in R

Cursus bekijken

Oefeninstructies

  • Verken eerst de structuur van ontbrekende waarden in oceanbuoys met vis_miss().
  • Verken de verdeling van wind oost-west (wind_ew) voor het ontbrekend-zijn van luchttemperatuur met geom_density().
  • Verken de verdeling van zeetemperatuur voor het ontbrekend-zijn van luchtvochtigheid met geom_density().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# First explore the missingness structure of `oceanbuoys` using `vis_miss()`
vis_miss(___)

# Explore the distribution of `wind_ew` for the missingness  
# of `air_temp_c_NA` using  `geom_density()`
bind_shadow(oceanbuoys) %>%
  ggplot(aes(x = ___, 
             color = air_temp_c_NA)) + 
  geom_density()

# Explore the distribution of sea temperature for the  
# missingness of humidity (humidity_NA) using  `geom_density()`
  ___(___) %>%
  ggplot(aes(x = ___,
             color = ___)) + 
  geom_density()
Code bewerken en uitvoeren