1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Błędy imputacji dla poszczególnych zmiennych

W poprzednim ćwiczeniu wyodrębniono szacunkowe błędy imputacji z wyników funkcji missForest. Otrzymano dwie wartości:

  • znormalizowany pierwiastek błędu średniokwadratowego (NRMSE) dla wszystkich zmiennych ciągłych;
  • odsetek błędnie sklasyfikowanych obserwacji (PFC) dla wszystkich zmiennych kategorycznych.

Może się jednak zdarzyć, że model imputacji świetnie radzi sobie z jedną zmienną ciągłą, a słabo z inną! Aby wykryć takie przypadki, wystarczy wskazać funkcji missForest, że ma obliczać błędy osobno dla każdej zmiennej. Służy do tego ustawienie argumentu variablewise na TRUE.

Zbiór danych biopics i pakiet missForest zostały już wczytane – przyjrzyjmy się bliżej błędom imputacji!

Instrukcje 1 / 3

undefined XP
    1
    2
    3
  • Użyj funkcji missForest do imputacji danych biopics tak, aby obliczano błędy osobno dla każdej zmiennej.