1. Nauka
  2. /
  3. Kursy
  4. /
  5. Praca z brakującymi danymi w R

Connected

ćwiczenie

Ile brakujących wartości jest w danych?

Gdy pracujesz z nowym zbiorem danych, jedną z pierwszych rzeczy, które warto sprawdzić, jest to, czy zawiera brakujące wartości – i ile ich jest.

Można użyć are_na(), aby je zidentyfikować i policzyć, ale najwygodniejszym sposobem zliczania braków jest funkcja n_miss(). Zwróci ona łączną liczbę brakujących wartości w danych.

Procent brakujących wartości możesz znaleźć za pomocą funkcji pct_miss. Zwróci ona odsetek brakujących wartości w danych.

Możesz też sprawdzić wartości uzupełniające – czyli ile wartości jest kompletnych – używając n_complete i pct_complete.

Instrukcje

100 XP

Korzystając z przykładowej ramki danych zawierającej wzrost i wagę dat_hw:

  • Użyj n_miss() na ramce danych dat_hw, aby policzyć łączną liczbę brakujących wartości w tej ramce danych.
  • Użyj n_miss() na zmiennej dat_hw$weight, aby policzyć łączną liczbę brakujących wartości w tej zmiennej.
  • Analogicznie użyj prop_miss(), n_complete() i prop_complete(), aby uzyskać proporcję braków oraz liczbę i proporcję kompletnych wartości – zarówno dla całej ramki danych, jak i dla poszczególnych zmiennych.