IniziaInizia gratis

Deduci MNAR

Nel precedente esercizio hai lavorato per identificare il tipo di valori mancanti a partire dal riepilogo della mancanza. In questo esercizio, continuerai su questa scia per identificare con sicurezza dati Missing Not at Random (MNAR).

Il riepilogo dei valori mancanti per il DataFrame diabetes è il seguente.

Il tuo obiettivo è ordinare il DataFrame diabetes in base a Serum_Insulin e individuare la correlazione tra Skin_Fold e Serum_Insulin.

Tieni presente che abbiamo usato una funzione proprietaria display() al posto di plt.show() per facilitarti la visualizzazione dell'output.

Questo esercizio fa parte del corso

Gestire i dati mancanti in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa il pacchetto missingno come msno.
  • Ordina i valori della colonna Serum_Insulin in diabetes.
  • Visualizza il riepilogo dei valori mancanti di Serum_Insulin con msno.matrix().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import missingno as msno
___

# Sort diabetes dataframe on 'Serum Insulin'
sorted_values = ___.___(___)

# Visualize the missingness summary of sorted
___.___(___)

# Display nullity matrix
display("/usr/local/share/datasets/matrix_sorted.png")
Modifica ed esegui il codice