1. Nauka
  2. /
  3. Kursy
  4. /
  5. Praca z brakującymi danymi w R

Connected

ćwiczenie

Inne podsumowania brakujących danych

Niektóre podsumowania brakujących danych są szczególnie przydatne w przypadku określonych typów danych. Przykładem są miss_var_span() i miss_var_run().

  • miss_var_span() oblicza liczbę brakujących wartości w podanej zmiennej dla powtarzającego się przedziału. Jest to bardzo przydatne w danych szeregów czasowych – pozwala szukać tygodniowych (7-dniowych) wzorców brakujących danych.

  • miss_var_run() oblicza liczbę „serii" lub „ciągów" brakujących wartości. Przydaje się do wykrywania nietypowych wzorców braków – na przykład powtarzającego się schematu: 5 kompletnych wartości i 5 brakujących.

Obie funkcje, miss_var_span() i miss_var_run(), działają z operatorem group_by z pakietu dplyr.

Instrukcje

100 XP

Korzystając ze zbioru danych pedestrian z pakietu naniar:

  • Oblicz podsumowania brakujących wartości dla zmiennych w zbiorze danych, używając miss_var_span() z przedziałem równym 4000.
  • Oblicz podsumowania brakujących wartości dla obserwacji w zbiorze danych, używając miss_var_run().
  • Połącz wyniki z operatorem group_by z pakietu dplyr, grupując według zmiennej month.