Investor yang hilang
Menangani data hilang adalah salah satu tugas paling umum dalam data science. Ada berbagai jenis missingness, serta berbagai jenis solusi untuk data hilang.
Anda baru saja menerima versi baru DataFrame banking yang berisi data jumlah dana yang ditahan dan diinvestasikan untuk pelanggan baru dan lama. Namun, ada baris dengan nilai inv_amount yang hilang.
Anda tahu bahwa sebagian besar pelanggan berusia di bawah 25 tahun belum memiliki rekening investasi, dan menduga hal ini bisa menjadi penyebab hilangnya data. Paket pandas, missingno, dan matplotlib.pyplot telah diimpor masing-masing sebagai pd, msno, dan plt. DataFrame banking ada di environment Anda.
Latihan ini adalah bagian dari kursus
Membersihkan Data di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print number of missing values in banking
print(____)
# Visualize missingness matrix
____
____