1. Learn
  2. /
  3. Courses
  4. /
  5. Praca z brakującymi danymi w R

Connected

Exercise

Tworzenie danych w postaci macierzy cienia

Braki danych bywają trudne do uchwycenia – zazwyczaj nie dają o sobie znać wprost, lecz kryją się gdzieś wśród pozostałych wartości w zbiorze danych.

Jednym ze sposobów na ich ujawnienie jest zmiana perspektywy: zamiast patrzeć na same wartości, warto zastanowić się, czy każda z nich w ogóle istnieje, czy też jej brakuje.

Funkcja as_shadow() w R przekształca ramkę danych w macierz cienia – specjalny format, w którym każda wartość przyjmuje jedną z dwóch postaci: brakująca (NA) lub obecna (!NA).

Nazwy kolumn macierzy cienia są takie same jak w oryginalnych danych, ale z dodanym sufiksem _NA.

Aby śledzić wartości danych i porównywać je ze stanem ich dostępności, użyj funkcji bind_shadow(). Dane w tym formacie – z kolumnami macierzy cienia dołączonymi do oryginalnych danych – noszą nazwę danych nabular.

Instructions

100 XP

Korzystając ze zbioru danych oceanbuoys:

  • Utwórz macierz cienia za pomocą funkcji as_shadow().
  • Utwórz dane nabular, łącząc macierz cienia z danymi przy użyciu funkcji bind_shadow().
  • Połącz tylko te zmienne, w których występują braki danych, używając bind_shadow(only_miss = TRUE).