1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Práce s chybějícími daty v R

Connected

cvičení

Imputace dat pod rozsah s nabular daty

Chceme mít přehled o hodnotách, které jsme imputovali. Bez toho je velmi obtížné posoudit, jak dobře imputace dopadla.

Procvičíme si imputaci dat a znovu vytvoříme vizualizace z předchozí sady cvičení — tentokrát tak, že imputujeme hodnoty pod rozsah dat.

Jde o velmi užitečný způsob, jak dále zkoumat chybějící hodnoty, a zároveň poskytuje základ pro jejich imputaci.

Nejprve imputujeme data pod rozsah pomocí impute_below_all() a výsledek vizualizujeme. Všimneme si, že i když vidíme, kde se chybějící hodnoty nacházejí, potřebujeme způsob, jak je sledovat. Právě k tomu slouží programovací vzor pro sledování chybějících dat.

Pokyny

100 XP

Pracuj s daty oceanbuoys:

  • Imputuj hodnoty pod rozsah pomocí impute_below_all().
  • Vizualizuj nové chybějící hodnoty — wind_ew na ose x a air_temp_c na ose y.
  • Imputuj data a sleduj je pomocí bind_shadow(), impute_below_all() a add_label_shadow().
  • Zobraz graf a prozkoumej imputované hodnoty.