Imputasi data di bawah rentang dengan data nabular
Kita ingin melacak nilai yang kita imputasi. Jika tidak, akan sangat sulit menilai seberapa baik nilai hasil imputasi tersebut.
Kita akan berlatih melakukan imputasi data dan membuat ulang visualisasi pada rangkaian latihan sebelumnya dengan mengimputasi nilai di bawah rentang data.
Ini adalah cara yang sangat berguna untuk membantu mengeksplorasi pola kehilangan data lebih lanjut, sekaligus menyediakan kerangka kerja untuk mengimputasi nilai hilang.
Pertama, kita akan melakukan imputasi data di bawah rentang menggunakan impute_below_all(), lalu memvisualisasikan datanya. Kita menyadari bahwa meskipun kita dapat melihat di mana nilai hilang berada dalam contoh ini, kita memerlukan cara untuk melacaknya. Pola pemrograman pelacakan data hilang dapat membantu untuk hal ini.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
Dengan menggunakan data oceanbuoys:
- Lakukan imputasi di bawah rentang menggunakan
impute_below_all(). - Visualisasikan nilai hilang baru untuk
wind_ewpada sumbu-x danair_temp_cpada sumbu-y. - Lakukan imputasi dan pelacakan data dengan
bind_shadow(),impute_below_all(), danadd_label_shadow(). - Tampilkan plot dan periksa nilai hasil imputasi.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Impute the oceanbuoys data below the range using `impute_below`.
ocean_imp <- impute_below_all(___)
# Visualize the new missing values
ggplot(___,
aes(x = ___, y = ___)) +
geom_point()
# Impute and track data with `bind_shadow`, `impute_below_all`, and `add_label_shadow`
ocean_imp_track <- bind_shadow(___) %>%
___() %>%
___()
# Look at the imputed values
___