1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Práce s chybějícími daty v R

Connected

cvičení

Kombinování a porovnávání různých imputačních modelů

Abychom mohli porovnat různé metody imputace, musíme je sloučit do jednoho datového rámce. Teď porovnáš tři různé přístupy k práci s chybějícími daty na datasetu oceanbuoys.

  • První metoda využívá pouze kompletní záznamy a je načtena jako ocean_cc.
  • Druhá metoda imputuje hodnoty pomocí lineárního modelu s předpověďmi založenými na větru a je načtena jako ocean_imp_lm_wind.

Třetí imputovaný dataset, ocean_imp_lm_all, vytvoříš pomocí lineárního modelu – imputuješ proměnné sea_temp_c, air_temp_c a humidity s využitím proměnných wind_ew, wind_ns, year, latitude, longitude.

Nakonec všechny datasety (ocean_cc, ocean_imp_lm_wind a ocean_imp_lm_all) spojíš dohromady a výsledek pojmenuješ bound_models.

Pokyny

100 XP
  • Vytvoř imputovaný dataset ocean_imp_lm_all pomocí lineárního modelu a imputuj proměnné sea_temp_c, air_temp_c a humidity s využitím proměnných wind_ew, wind_ns, year, latitude, longitude.
  • Spoj všechny datasety do jednoho objektu a pojmenuj ho bound_models.