1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Práce s chybějícími daty v R

Connected

cvičení

Vytvoření dat stínové matice

Chybějící data mohou být záludná – obvykle se sama nehlásí a místo toho se skrývají mezi ostatními hodnotami v datové sadě.

Jedním ze způsobů, jak je odhalit, je změnit pohled na data: přemýšlet o každé hodnotě tak, zda chybí, nebo nechybí.

Funkce as_shadow() v R převede datový rámec na stínovou matici – speciální datový formát, kde každá hodnota nabývá stavu buď chybí (NA), nebo nechybí (!NA).

Názvy sloupců stínové matice jsou stejné jako v původních datech, jen s přidanou příponou _NA.

Aby bylo možné porovnávat datové hodnoty s jejich stavem chybějících dat, použij funkci bind_shadow(). Data v tomto formátu – s připojenou stínovou maticí – se označují jako nabular data.

Pokyny

100 XP

Pracuj s datovou sadou oceanbuoys:

  • Vytvoř data stínové matice pomocí as_shadow()
  • Vytvoř nabular data připojením stínové matice k datům pomocí bind_shadow()
  • Připoj pouze proměnné s chybějícími hodnotami pomocí bind_shadow(only_miss = TRUE)