1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Używanie macierzy predyktorów

Ważną decyzją przy imputacji opartej na modelach jest wybór zmiennych, które mają pełnić rolę predyktorów – i w których modelach. W funkcji mice() kontroluje to macierz predyktorów. Domyślnie wszystkie zmienne są używane do imputacji wszystkich pozostałych.

Jeśli zbiór danych zawiera wiele zmiennych lub brakuje czasu na rzetelną selekcję modeli, możesz skorzystać z funkcjonalności pakietu mice do tworzenia macierzy predyktorów na podstawie korelacji między zmiennymi. Taką macierz można następnie przekazać do mice(). W tym ćwiczeniu właśnie to przećwiczysz: najpierw zbudujesz macierz predyktorów tak, aby każda zmienna była imputowana przy użyciu zmiennych najbardziej z nią skorelowanych, a potem przekażesz tę macierz do funkcji imputującej. Wypróbujmy tę prostą selekcję modeli!

Instrukcje 1 / 3

undefined XP
    1
    2
    3
  • Utwórz macierz predyktorów, która wybiera predyktory mające korelację z docelową zmienną równą co najmniej 0,1, i przypisz wynik do pred_mat.