1. Nauka
  2. /
  3. Kursy
  4. /
  5. Praca z brakującymi danymi w R

Connected

ćwiczenie

Łączenie i porównywanie wielu modeli imputacji

Aby ocenić różne metody imputacji, musimy zebrać je w jednej ramce danych. Porównasz trzy różne podejścia do obsługi brakujących danych na zbiorze oceanbuoys.

  • Pierwsza metoda polega na użyciu wyłącznie kompletnych przypadków i jest wczytana jako ocean_cc.
  • Druga metoda to imputacja wartości za pomocą modelu liniowego z prognozami opartymi na wietrze – wczytana jako ocean_imp_lm_wind.

Stworzysz trzeci zbiór danych po imputacji, ocean_imp_lm_all, używając modelu liniowego do imputacji zmiennych sea_temp_c, air_temp_c i humidity na podstawie zmiennych wind_ew, wind_ns, year, latitude, longitude.

Następnie połączysz wszystkie zbiory danych (ocean_cc, ocean_imp_lm_wind i ocean_imp_lm_all) w jeden obiekt o nazwie bound_models.

Instrukcje

100 XP
  • Utwórz zbiór danych po imputacji o nazwie ocean_imp_lm_all, używając modelu liniowego do imputacji zmiennych sea_temp_c, air_temp_c i humidity na podstawie zmiennych wind_ew, wind_ns, year, latitude, longitude.
  • Połącz wszystkie zbiory danych w jeden obiekt o nazwie bound_models.