MulaiMulai sekarang secara gratis

Menentukan MNAR

Pada latihan sebelumnya, Anda mengidentifikasi jenis nilai hilang berdasarkan ringkasan missingness. Pada latihan ini, Anda akan melanjutkannya untuk secara tegas mengidentifikasi data yang Missing Not at Random (MNAR).

Ringkasan missingness untuk DataFrame diabetes ditunjukkan di bawah ini.

Tujuan Anda adalah mengurutkan DataFrame diabetes berdasarkan Serum_Insulin dan mengidentifikasi korelasi antara Skin_Fold dan Serum_Insulin.

Catat bahwa kami menggunakan fungsi khusus display() alih-alih plt.show() agar Anda lebih mudah melihat keluaran.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di Python

Lihat Kursus

Petunjuk latihan

  • Impor paket missingno sebagai msno.
  • Urutkan nilai kolom Serum_Insulin dalam diabetes.
  • Visualisasikan ringkasan missingness dari Serum_Insulin dengan msno.matrix().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import missingno as msno
___

# Sort diabetes dataframe on 'Serum Insulin'
sorted_values = ___.___(___)

# Visualize the missingness summary of sorted
___.___(___)

# Display nullity matrix
display("/usr/local/share/datasets/matrix_sorted.png")
Edit dan Jalankan Kode