Investor yang hilang
Menangani data hilang adalah salah satu tugas paling umum dalam data science. Ada berbagai jenis missingness, serta berbagai jenis solusi untuk data hilang.
Anda baru saja menerima versi baru DataFrame banking yang berisi data jumlah dana yang ditahan dan diinvestasikan untuk pelanggan baru dan lama. Namun, ada baris dengan nilai inv_amount yang hilang.
Anda tahu bahwa sebagian besar pelanggan berusia di bawah 25 tahun belum memiliki rekening investasi, dan menduga hal ini bisa menjadi penyebab hilangnya data. Paket pandas, missingno, dan matplotlib.pyplot telah diimpor masing-masing sebagai pd, msno, dan plt. DataFrame banking ada di environment Anda.
Latihan ini merupakan bagian dari kursus
Membersihkan Data di Python
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Print number of missing values in banking
print(____)
# Visualize missingness matrix
____
____