MulaiMulai sekarang secara gratis

Memvisualisasikan data hilang

Menangani data hilang adalah salah satu tugas paling umum dalam data science. Ada berbagai jenis missingness, sekaligus berbagai pendekatan untuk menangani data hilang.

Anda baru saja menerima versi baru data frame accounts yang memuat data jumlah yang disimpan dan jumlah yang diinvestasikan untuk pelanggan baru dan lama. Namun, ada baris dengan nilai inv_amount yang hilang.

Anda tahu bahwa sebagian besar pelanggan di bawah 25 tahun belum memiliki rekening investasi, dan Anda menduga hal tersebut dapat menjadi penyebab missingness. Paket dplyr dan visdat sudah dimuat dan accounts tersedia.

Latihan ini adalah bagian dari kursus

Membersihkan Data di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Visualize the missing values by column
___
Edit dan Jalankan Kode