Data nabular dan pengisian berdasarkan keberhilangan
Statistik ringkas berguna untuk dihitung, tetapi seperti pepatah, sebuah gambar dapat mengungkapkan seribu kata.
Dalam latihan ini, Anda akan mengeksplorasi bagaimana menggunakan data nabular untuk menelaah variasi sebuah variabel berdasarkan keberhilangan variabel lain.
Kita akan menggunakan himpunan data oceanbuoys dari naniar.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
- Pertama, jelajahi struktur keberhilangan pada
oceanbuoysmenggunakanvis_miss(). - Jelajahi sebaran angin timur-barat (
wind_ew) berdasarkan keberhilangan suhu udara menggunakangeom_density(). - Jelajahi sebaran suhu laut berdasarkan keberhilangan kelembapan menggunakan
geom_density().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# First explore the missingness structure of `oceanbuoys` using `vis_miss()`
vis_miss(___)
# Explore the distribution of `wind_ew` for the missingness
# of `air_temp_c_NA` using `geom_density()`
bind_shadow(oceanbuoys) %>%
ggplot(aes(x = ___,
color = air_temp_c_NA)) +
geom_density()
# Explore the distribution of sea temperature for the
# missingness of humidity (humidity_NA) using `geom_density()`
___(___) %>%
ggplot(aes(x = ___,
color = ___)) +
geom_density()