IniziaInizia gratis

Confronto di grafici di densità

Le diverse imputazioni che hai eseguito in precedenza possono essere confrontate graficamente con i loro grafici di densità. Da questi grafici potrai analizzare facilmente e individuare l'insieme di dati che ha la distribuzione più simile rispetto all'insieme di dati originale. Potrai anche vedere come un'imputazione possa introdurre bias.

In questo esercizio confronterai i grafici di densità dei DataFrame imputati per diabetes che hai creato in precedenza.

I DataFrame diabetes_cc, diabetes_mean_imputed, diabetes_knn_imputed e diabetes_mice_imputed sono già stati caricati per te, insieme a matplotlib.pyplot come plt.

Questo esercizio fa parte del corso

Gestire i dati mancanti in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Disegna un grafico di densità per la colonna 'Skin_Fold' per ciascun DataFrame.
  • Imposta le etichette usando la lista labels.
  • Imposta l'etichetta per l'asse x su 'Skin Fold'.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Plot graphs of imputed DataFrames and the complete case
diabetes_cc['___'].___(___='___', c='red', linewidth=3)
diabetes_mean_imputed['___'].plot(___='___')
diabetes_knn_imputed['___'].plot(___='___')
diabetes_mice_imputed['___'].plot(___='___')

# Create labels for the four DataFrames
labels = ['Baseline (Complete Case)', 'Mean Imputation', 'KNN Imputation', 'MICE Imputation']
plt.legend(___)

# Set the x-label as Skin Fold
plt.xlabel('___')

plt.show()
Modifica ed esegui il codice