MulaiMulai sekarang secara gratis

Mengevaluasi imputasi yang buruk

Untuk mengevaluasi imputasi, akan membantu jika Anda mengetahui seperti apa bentuk yang buruk. Untuk mengeksplorasinya, mari kita lihat salah satu metode imputasi yang umumnya buruk: mengimputasi dengan nilai rata-rata.

Dalam latihan ini, kita akan menelusuri cara kerja metode imputasi rata-rata menggunakan box plot, dengan himpunan data oceanbuoys.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di R

Lihat Kursus

Petunjuk latihan

Untuk himpunan data oceanbuoys:

  • Imputasikan nilai rata-rata dengan impute_mean_all(), dan lacak imputasi ini dengan add_label_shadow().
  • Telusuri nilai hasil imputasi pada kelembapan (humidity) menggunakan box plot.
  • Telusuri nilai hasil imputasi pada suhu udara (air_temp_c) menggunakan box plot.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Impute the mean value and track the imputations 
ocean_imp_mean <- bind_shadow(___) %>% 
  ___() %>% 
  ___()

# Explore the mean values in humidity in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()

# Explore the values in air temperature in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()
Edit dan Jalankan Kode