1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Práce s chybějícími daty v R

Connected

cvičení

Kolik chybějících hodnot tam je?

Jednou z prvních věcí, které si u nového datasetu budeš chtít ověřit, je to, zda obsahuje nějaké chybějící hodnoty a kolik jich je.

Dalo by se použít are_na() a chybějící hodnoty ručně sečíst, ale nejefektivnější způsob je funkce n_miss(). Ta ti vrátí celkový počet chybějících hodnot v datech.

Podíl chybějících hodnot pak zjistíš pomocí funkce pct_miss. Ta ti ukáže procentuální zastoupení chybějících hodnot v datech.

Můžeš také zjistit opak – tedy kolik hodnot je úplných – pomocí funkcí n_complete a pct_complete.

Pokyny

100 XP

Pracuj s ukázkovým datovým rámcem výšek a vah dat_hw:

  • Pomocí n_miss() na datovém rámci dat_hw zjisti celkový počet chybějících hodnot v tomto rámci.
  • Pomocí n_miss() na proměnné dat_hw$weight zjisti celkový počet chybějících hodnot v ní.
  • Podobně použij prop_miss(), n_complete() a prop_complete() k získání podílu chybějících hodnot a počtu i podílu úplných hodnot – pro celý datový rámec i pro jednotlivé proměnné.