Mengevaluasi imputasi: Skala
Meskipun imputasi rata-rata mungkin tidak terlihat terlalu buruk saat kita membandingkannya menggunakan box plot, penting untuk memahami variasi dalam data. Inilah sebabnya mengapa penting untuk menelusuri bagaimana skala dan sebaran nilai imputasi berubah dibandingkan dengan data aslinya.
Salah satu cara untuk mengevaluasi kesesuaian skala imputasi adalah menggunakan scatter plot untuk melihat apakah nilai-nilainya tampak sesuai atau tidak.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
Dengan menggunakan data yang sudah diimputasi, ocean_imp_mean:
- Telusuri imputasi pada suhu udara (sumbu x) dan kelembapan (sumbu y) menggunakan scatter plot, jangan lupa gunakan
color = any_missing. - Kembangkan visualisasi sebelumnya dengan membuat facet berdasarkan tahun.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Explore imputations in air temperature and humidity,
# coloring by the variable, any_missing
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()
# Explore imputations in air temperature and humidity,
# coloring by the variable, any_missing, and faceting by year
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
___() +
facet_wrap(~___)