1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Wykrywanie zbieżności

Świetna robota z iterowaniem po zmiennych w poprzednim ćwiczeniu! Ale ile iteracji jest potrzebnych? Gdy imputowane wartości przestają się zmieniać w kolejnej iteracji, możemy zatrzymać proces.

Rozszerzysz teraz swój kod o obliczanie różnic między imputowanymi zmiennymi w kolejnych iteracjach. Użyjesz do tego funkcji Mean Absolute Percentage Change, zdefiniowanej poniżej:

mapc <- function(a, b) {
  mean(abs(b - a) / a, na.rm = TRUE)
}

Funkcja mapc() zwraca pojedynczą liczbę, która mówi, jak bardzo b różni się od a. Użyjesz jej, aby sprawdzić, jak bardzo imputowane zmienne zmieniają się między iteracjami. Na tej podstawie zdecydujesz, ile iteracji jest potrzebnych!

Maski logiczne missing_air_temp i missing_humidity są dla ciebie dostępne, podobnie jak zainicjalizowany metodą hotdeck zbiór danych tao_imp.

Instrukcje 1 / 3

undefined XP
    1
    2
    3
  • Utwórz dwa puste wektory o nazwach diff_air_temp i diff_humidity do przechowywania różnic w odpowiednich zmiennych.
  • Przypisz wynik poprzedniej iteracji (lub inicjalizacji) tao_imp do zmiennej prev_iter.