Visualisasi pertama Anda tentang data yang hilang
Mengetahui di mana nilai yang hilang berada dalam data Anda bisa jadi sulit, dan di sinilah visualisasi sangat membantu.
Fungsi vis_miss() membuat visualisasi ringkasan tentang keberadaan nilai hilang dalam data. Fungsi ini juga memiliki opsi untuk mengelompokkan baris berdasarkan keberadaan nilai hilang, menggunakan cluster = TRUE; serta opsi untuk mengurutkan kolom dari yang paling banyak hingga paling sedikit nilai hilangnya (sort_miss = TRUE).
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
Menggunakan himpunan data riskfactors dari naniar:
- Gunakan
vis_miss()untuk memvisualisasikan keberadaan nilai hilang dalam data. - Gunakan
vis_miss()dengancluster = TRUEuntuk mengeksplorasi beberapa kelompok nilai hilang. - Gunakan
vis_miss()dan urutkan nilai hilang dengansort_missuntuk menyusun kolom berdasarkan tingkat nilai hilang.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Visualize all of the missingness in the `riskfactors` dataset
vis_miss(___)
# Visualize and cluster all of the missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)
# visualize and sort the columns by missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)