MulaiMulai sekarang secara gratis

Tebak jenis missingness

Menganalisis jenis missingness membantu Anda menyimpulkan cara terbaik untuk menangani data hilang. Himpunan data diabetes Pima Indians sangat dikenal karena memiliki data hilang. Pima Indians adalah suatu kelompok etnis yang lebih rentan terhadap diabetes. Himpunan data ini memuat beberapa hasil tes laboratorium yang dilakukan pada anggota komunitas ini.

Dalam video pelajaran, Anda mempelajari 3 jenis pola missingness. Pada latihan ini, Anda terlebih dahulu akan memvisualisasikan ringkasan missingness lalu mengidentifikasi jenis missingness yang terdapat dalam DataFrame.

DataFrame telah dimuat untuk Anda sebagai diabetes.

Catatan: kami menggunakan fungsi khusus display() alih-alih plt.show() agar Anda lebih mudah melihat keluaran.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import missingno as msno
___

# Visualize the missingness summary
___

# Display nullity matrix
display("/usr/local/share/datasets/matrix_diabetes.png")
Edit dan Jalankan Kode