Menentukan MNAR
Pada latihan sebelumnya, Anda mengidentifikasi jenis nilai hilang berdasarkan ringkasan missingness. Pada latihan ini, Anda akan melanjutkannya untuk secara tegas mengidentifikasi data yang Missing Not at Random (MNAR).
Ringkasan missingness untuk DataFrame diabetes ditunjukkan di bawah ini.

Tujuan Anda adalah mengurutkan DataFrame diabetes berdasarkan Serum_Insulin dan mengidentifikasi korelasi antara Skin_Fold dan Serum_Insulin.
Catat bahwa kami menggunakan fungsi khusus display() alih-alih plt.show() agar Anda lebih mudah melihat keluaran.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di Python
Petunjuk latihan
- Impor paket
missingnosebagaimsno. - Urutkan nilai kolom
Serum_Insulindalamdiabetes. - Visualisasikan ringkasan missingness dari
Serum_Insulindenganmsno.matrix().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import missingno as msno
___
# Sort diabetes dataframe on 'Serum Insulin'
sorted_values = ___.___(___)
# Visualize the missingness summary of sorted
___.___(___)
# Display nullity matrix
display("/usr/local/share/datasets/matrix_sorted.png")