Gëimputeerde waarden visualiseren in een scatterplot
Laten we nu een van de eerdere grafieken uit hoofdstuk drie opnieuw maken die geom_miss_point() gebruikte.
Om dit te doen, moeten we de data imputeren onder het bereik van de gegevens. Dit is een speciale vorm van imputatie om de data te verkennen. Deze imputatie laat zien wat we moeten oefenen: hoe je ontbrekende waarden bijhoudt. Om de data onder het bereik van de gegevens te imputeren, gebruiken we de functie impute_below_all().
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
Gebruik de oceanbuoys-data:
- Imputeer en houd de ontbrekende waarden bij met
bind_shadow()enimpute_below_all(), enadd_label_shadow(). - Visualiseer de missingness in wind en luchttemperatuur respectievelijk op de x- en y-as, en kleur ontbrekende luchttemperaturen met
air_temp_c_NA. - Visualiseer luchtvochtigheid en luchttemperatuur respectievelijk op de x- en y-as, en kleur alle gevallen met ontbrekende waarden met de variabele
any_missing.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Impute and track the missing values
ocean_imp_track <- bind_shadow(___) %>%
impute_below_all() %>%
add_label_shadow()
# Visualize the missingness in wind and air temperature,
# coloring missing air temp values with air_temp_c_NA
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()
# Visualize humidity and air temp, coloring any missing cases using the variable any_missing
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()