1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Práce s chybějícími daty v R

Connected

cvičení

Vyhodnocení imputací: Napříč mnoha proměnnými

Doposud jsme se zabývali způsoby, jak zkoumat jednotlivé proměnné nebo dvojice proměnných a jejich imputované hodnoty. Někdy ale potřebuješ prozkoumat imputace napříč mnoha proměnnými najednou. K tomu je nutné data trochu upravit a přeuspořádat. Tato lekce ukazuje, jak takové úpravy provést – v případě nabular dat to může být o něco složitější. Funkce shadow_long() převede data do správného tvaru pro tento typ vizualizací.

Pokyny

100 XP
  • Pomocí shadow_long() sesbírej imputovaná data ocean_imp_mean se zaměřením na proměnné humidity a air_temp_c.
  • Vypiš data a prohlédni si je.
  • Prozkoumej imputace pomocí histogramu s geom_histogram() – hodnoty umísti na osu x, vybarvi je podle přítomnosti chybějících hodnot a rozděl graf pomocí fazetování podle variable.