Membuat Tabel Keberadaan Data Hilang
Ringkasan keberadaan data hilang yang baru saja kita hitung memberikan jumlah dan persentase observasi yang hilang untuk kasus dan variabel.
Cara lain untuk merangkum data hilang adalah dengan membuat tabel berapa kali terdapat 0, 1, 2, 3, data hilang dalam sebuah variabel, atau dalam sebuah kasus.
Dalam latihan ini kita akan membuat tabel jumlah data hilang pada setiap kasus dan variabel menggunakan miss_var_table() dan miss_case_table(), serta mengombinasikan ringkasan ini dengan operator group_by dari dplyr untuk mengeksplorasi ringkasan berdasarkan variabel pengelompokan dalam himpunan data.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
Untuk himpunan data airquality:
- Buat tabel data hilang untuk setiap variabel menggunakan
miss_var_table(). - Buat tabel data hilang untuk setiap kasus menggunakan
miss_case_table(). - Gabungkan tabulasi sebelumnya dengan fungsi
group_by()daridplyruntuk membuat tabulasi untuk setiap variabel dan kasus, berdasarkan setiapMonth.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Tabulate missingness in each variable and case of the `airquality` dataset
___(airquality)
___(___)
# Tabulate the missingness in each variable, grouped by Month, in the `airquality` dataset
airquality %>% group_by(___) %>% miss_var_table()
# Tabulate of missingness in each case, grouped by Month, in the `airquality` dataset
airquality %>% ___ %>% miss_case_table()