1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Wybór domyślnych modeli

MICE tworzy osobny model imputacji dla każdej zmiennej w danych. Rodzaj modelu zależy od typu danej zmiennej. Popularnym sposobem określenia używanych modeli jest ustawienie domyślnego modelu dla każdego z czterech typów zmiennych.

Można to zrobić, przekazując argument defaultMethod do funkcji mice(). Powinien to być wektor o długości 4, zawierający domyślne metody imputacji dla:

  1. Zmiennych ciągłych,
  2. Zmiennych binarnych,
  3. Zmiennych kategorycznych (czynniki nieuporządkowane),
  4. Zmiennych czynnikowych (czynniki uporządkowane).

W tym ćwiczeniu skorzystasz z dokumentacji pakietu mice, aby przejrzeć listę dostępnych metod i wybrać te, które algorytm ma stosować. Czas na selekcję modeli!

Instrukcje

100 XP
  • W dokumentacji RDocumentation zwróconej przez ?mice znajdziesz tabelę zawierającą słowo kluczowe dla każdej metody.
  • Dokonaj imputacji zbioru danych biopics za pomocą funkcji mice(), używając następujących domyślnych metod (w tej kolejności): drzewa klasyfikacji i regresji, liniowa analiza dyskryminacyjna, dopasowanie predykcyjnej średniej (predictive mean matching), proporcjonalny model szans.
  • Wyświetl obiekt biopics_multiimp, aby sprawdzić, która metoda została użyta dla której zmiennej.