MulaiMulai sekarang secara gratis

Investor yang hilang

Menangani data hilang adalah salah satu tugas paling umum dalam data science. Ada berbagai jenis missingness, serta berbagai jenis solusi untuk data hilang.

Anda baru saja menerima versi baru DataFrame banking yang berisi data jumlah dana yang ditahan dan diinvestasikan untuk pelanggan baru dan lama. Namun, ada baris dengan nilai inv_amount yang hilang.

Anda tahu bahwa sebagian besar pelanggan berusia di bawah 25 tahun belum memiliki rekening investasi, dan menduga hal ini bisa menjadi penyebab hilangnya data. Paket pandas, missingno, dan matplotlib.pyplot telah diimpor masing-masing sebagai pd, msno, dan plt. DataFrame banking ada di environment Anda.

Latihan ini adalah bagian dari kursus

Membersihkan Data di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Print number of missing values in banking
print(____)

# Visualize missingness matrix
____
____
Edit dan Jalankan Kode