1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Ocena jakości imputacji za pomocą wykresu marginesowego

W poprzednim ćwiczeniu dokonano imputacji średnią dla zmiennej air_temp i dodano zmienną wskaźnikową oznaczającą wartości imputowane – air_temp_imp. Czas sprawdzić, jak dobrze to działa.

Przyglądając się danym tao, można zauważyć, że zawierają one również zmienną sea_surface_temp, która powinna być dodatnio skorelowana z air_temp. Jeśli tak jest, obie temperatury powinny być jednocześnie wysokie lub jednocześnie niskie. Imputowanie średniej temperatury powietrza w sytuacji, gdy temperatura powierzchni morza jest wysoka lub niska, zaburza tę zależność.

Aby to zbadać, w tym ćwiczeniu wybierzesz dwie zmienne temperaturowe i zmienną wskaźnikową, a następnie użyjesz ich do narysowania wykresu marginesowego. Oceniamy imputację średnią!

Instrukcje 1 / 2

undefined XP
    1
    2
  • Użyj select(), aby wybrać wyłącznie air_temp, sea_surface_temp i air_temp_imp (w tej kolejności) z tao_imp.
  • Przekaż wybrane zmienne do odpowiedniej funkcji tworzącej wykres marginesowy, ustawiając odpowiednio argument delimiter.