Mengevaluasi imputasi yang buruk
Untuk mengevaluasi imputasi, akan membantu jika Anda mengetahui seperti apa bentuk yang buruk. Untuk mengeksplorasinya, mari kita lihat salah satu metode imputasi yang umumnya buruk: mengimputasi dengan nilai rata-rata.
Dalam latihan ini, kita akan menelusuri cara kerja metode imputasi rata-rata menggunakan box plot, dengan himpunan data oceanbuoys.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
Untuk himpunan data oceanbuoys:
- Imputasikan nilai rata-rata dengan
impute_mean_all(), dan lacak imputasi ini denganadd_label_shadow(). - Telusuri nilai hasil imputasi pada kelembapan (
humidity) menggunakan box plot. - Telusuri nilai hasil imputasi pada suhu udara (
air_temp_c) menggunakan box plot.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Impute the mean value and track the imputations
ocean_imp_mean <- bind_shadow(___) %>%
___() %>%
___()
# Explore the mean values in humidity in the imputed dataset
ggplot(___,
aes(x = ___, y = ___)) +
geom_boxplot()
# Explore the values in air temperature in the imputed dataset
ggplot(___,
aes(x = ___, y = ___)) +
geom_boxplot()