Mengevaluasi imputasi (banyak model & variabel)
Saat Anda membangun sebuah model imputasi, sebaiknya bandingkan dengan metode lain.
Dalam pelajaran ini, Anda akan menambahkan model imputasi terakhir yang memuat satu informasi tambahan yang berguna untuk membantu menjelaskan sebagian variasi dalam data. Anda kemudian akan membandingkan nilainya, seperti yang telah dilakukan pada pelajaran sebelumnya.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
Menggunakan himpunan data oceanbuoys:
- Lakukan imputasi data dengan
impute_lm(), tambahkanyearke dalam model. - Gabungkan metode imputasi, tempatkan
ocean_imp_meankemean,ocean_imp_lm_windkelm_wind, danocean_imp_lm_wind_yearkelm_wind_year. - Amati nilai
air_temp_c(sumbu x) danhumidity(sumbu y), beri warna berdasarkan nilai yang hilang, dan lakukan facet berdasarkan model imputasi.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
add_label_shadow()
# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
lm_wind = ocean_imp_lm_wind,
lm_wind_year = ___,
.id = "imp_model")
# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) +
geom_point() + facet_wrap(~___)