MulaiMulai sekarang secara gratis

Mengevaluasi dan membandingkan imputasi

Saat Anda membangun model imputasi, sebaiknya bandingkan dengan metode lain. Dalam pelajaran ini, kita akan membandingkan himpunan data yang sebelumnya diimputasi menggunakan impute_lm() dengan himpunan data yang diimputasi menggunakan rata-rata. Keduanya telah disertakan dalam latihan ini masing-masing sebagai ocean_imp_lm_wind dan ocean_imp_mean.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di R

Lihat Kursus

Petunjuk latihan

  • Gabungkan model-model tersebut menggunakan bind_rows(), tempatkan model ocean_imp_mean ke dalam mean, dan ocean_imp_lm_wind ke dalam lm_wind.
  • Amati nilai air_temp dan humidity dalam bentuk scatter plot, tempatkan air_temp_c pada sumbu x, humidity pada sumbu y, warnai berdasarkan nilai yang hilang, dan buat facet berdasarkan model imputasi yang digunakan (imp_model).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Bind the models together 
bound_models <- bind_rows(mean = ___,
                          lm_wind = ___,
                          .id = "imp_model")

# Inspect the values of air_temp and humidity as a scatter plot
ggplot(___, 
       aes(x = ___, 
           y = ___, 
           color = any_missing)) +
  geom_point() + 
  facet_wrap(~___)
Edit dan Jalankan Kode