1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Práce s chybějícími daty v R

Connected

cvičení

Další souhrny chybějících hodnot

Některé souhrny chybějících hodnot se hodí zejména pro určité typy dat. Patří mezi ně například miss_var_span() a miss_var_run().

  • miss_var_span() spočítá počet chybějících hodnot v zadané proměnné pro opakující se intervaly. To se výborně hodí u dat z časových řad, kde hledáš třeba týdenní (7denní) vzory chybějících hodnot.

  • miss_var_run() spočítá počet „sérií" nebo „sekvencí" chybějících hodnot. Hodí se k odhalení neobvyklých vzorů – například se může ukázat, že se opakuje pattern 5 úplných a 5 chybějících hodnot.

Obě funkce miss_var_span() i miss_var_run() fungují s operátorem group_by z balíčku dplyr.

Pokyny

100 XP

Pracuj s datasetem pedestrian z balíčku naniar:

  • Pomocí miss_var_span() vypočítej souhrny chybějících hodnot pro proměnné v datasetu, a to pro interval 4000.
  • Pomocí miss_var_run() vypočítej souhrny chybějících hodnot pro jednotlivé záznamy v datasetu.
  • Výsledky kombinuj s operátorem group_by z balíčku dplyr pro proměnnou month.