1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Imputacja średnią zmiennej temperature

Imputacja średnią bywa ryzykownym zabiegiem. Jeśli imputowana zmienna jest skorelowana z innymi zmiennymi, imputowane wartości mogą tę korelację zaburzyć. Zapowiedź tego problemu pojawiła się już w poprzednim ćwiczeniu, podczas analizy zmiennej air_temp.

Aby sprawdzić, czy te obawy są uzasadnione, w tym ćwiczeniu wykonasz imputację średnią na zmiennej air_temp, a jednocześnie utworzysz binarny wskaźnik wskazujący miejsca, w których wartości zostały uzupełnione. Przyda się on w następnym ćwiczeniu, gdy będziesz oceniać jakość imputacji. Czas wypełnić brakujące wartości!

Instrukcje

100 XP
  • W potoku modyfikującym tao utwórz nową zmienną o nazwie air_temp_imp, która przyjmuje wartość TRUE, gdy air_temp jest brakująca, a FALSE w przeciwnym razie.
  • W dalszej części tego samego potoku nadpisz air_temp jej własną średnią wszędzie tam, gdzie wartość jest brakująca, pozostawiając pozostałe wartości bez zmian – wynik przypisz do tao_imp.