Mengevaluasi dan membandingkan imputasi
Saat Anda membangun model imputasi, sebaiknya bandingkan dengan metode lain. Dalam pelajaran ini, kita akan membandingkan himpunan data yang sebelumnya diimputasi menggunakan impute_lm() dengan himpunan data yang diimputasi menggunakan rata-rata. Keduanya telah disertakan dalam latihan ini masing-masing sebagai ocean_imp_lm_wind dan ocean_imp_mean.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
- Gabungkan model-model tersebut menggunakan
bind_rows(), tempatkan modelocean_imp_meanke dalammean, danocean_imp_lm_windke dalamlm_wind. - Amati nilai
air_tempdanhumiditydalam bentuk scatter plot, tempatkanair_temp_cpada sumbu x,humiditypada sumbu y, warnai berdasarkan nilai yang hilang, dan buat facet berdasarkan model imputasi yang digunakan (imp_model).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Bind the models together
bound_models <- bind_rows(mean = ___,
lm_wind = ___,
.id = "imp_model")
# Inspect the values of air_temp and humidity as a scatter plot
ggplot(___,
aes(x = ___,
y = ___,
color = any_missing)) +
geom_point() +
facet_wrap(~___)