Visualisasikan nilai imputasi dalam plot sebar
Sekarang, mari kita ulang salah satu plot sebelumnya yang kita lihat di bab tiga yang menggunakan geom_miss_point().
Untuk melakukannya, kita perlu melakukan imputasi data di bawah rentang data. Ini adalah jenis imputasi khusus untuk mengeksplorasi data. Imputasi ini akan menggambarkan apa yang perlu kita latih: cara melacak nilai yang hilang. Untuk melakukan imputasi data di bawah rentang data, kita menggunakan fungsi impute_below_all().
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
Menggunakan data oceanbuoys:
- Lakukan imputasi dan lacak nilai yang hilang menggunakan
bind_shadow()danimpute_below_all(), sertaadd_label_shadow(). - Visualisasikan missingness pada kecepatan angin dan suhu udara masing-masing pada sumbu x dan y, dan warnai nilai suhu udara yang hilang dengan
air_temp_c_NA. - Visualisasikan kelembapan dan suhu udara masing-masing pada sumbu x dan y, dan warnai kasus apa pun yang memiliki nilai hilang menggunakan variabel
any_missing.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Impute and track the missing values
ocean_imp_track <- bind_shadow(___) %>%
impute_below_all() %>%
add_label_shadow()
# Visualize the missingness in wind and air temperature,
# coloring missing air temp values with air_temp_c_NA
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()
# Visualize humidity and air temp, coloring any missing cases using the variable any_missing
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()