MulaiMulai sekarang secara gratis

Mengevaluasi imputasi (banyak model & variabel)

Saat Anda membangun sebuah model imputasi, sebaiknya bandingkan dengan metode lain.

Dalam pelajaran ini, Anda akan menambahkan model imputasi terakhir yang memuat satu informasi tambahan yang berguna untuk membantu menjelaskan sebagian variasi dalam data. Anda kemudian akan membandingkan nilainya, seperti yang telah dilakukan pada pelajaran sebelumnya.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di R

Lihat Kursus

Petunjuk latihan

Menggunakan himpunan data oceanbuoys:

  • Lakukan imputasi data dengan impute_lm(), tambahkan year ke dalam model.
  • Gabungkan metode imputasi, tempatkan ocean_imp_mean ke mean, ocean_imp_lm_wind ke lm_wind, dan ocean_imp_lm_wind_year ke lm_wind_year.
  • Amati nilai air_temp_c (sumbu x) dan humidity (sumbu y), beri warna berdasarkan nilai yang hilang, dan lakukan facet berdasarkan model imputasi.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
  impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
  impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
  add_label_shadow()

# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
                          lm_wind = ocean_imp_lm_wind,
                          lm_wind_year = ___,
                          .id = "imp_model")

# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) + 
  geom_point() + facet_wrap(~___)
Edit dan Jalankan Kode