Deduci MNAR
Nel precedente esercizio hai lavorato per identificare il tipo di valori mancanti a partire dal riepilogo della mancanza. In questo esercizio, continuerai su questa scia per identificare con sicurezza dati Missing Not at Random (MNAR).
Il riepilogo dei valori mancanti per il DataFrame diabetes è il seguente.

Il tuo obiettivo è ordinare il DataFrame diabetes in base a Serum_Insulin e individuare la correlazione tra Skin_Fold e Serum_Insulin.
Tieni presente che abbiamo usato una funzione proprietaria display() al posto di plt.show() per facilitarti la visualizzazione dell'output.
Questo esercizio fa parte del corso
Gestire i dati mancanti in Python
Istruzioni dell'esercizio
- Importa il pacchetto
missingnocomemsno. - Ordina i valori della colonna
Serum_Insulinindiabetes. - Visualizza il riepilogo dei valori mancanti di
Serum_Insulinconmsno.matrix().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import missingno as msno
___
# Sort diabetes dataframe on 'Serum Insulin'
sorted_values = ___.___(___)
# Visualize the missingness summary of sorted
___.___(___)
# Display nullity matrix
display("/usr/local/share/datasets/matrix_sorted.png")