Confronto di grafici di densità
Le diverse imputazioni che hai eseguito in precedenza possono essere confrontate graficamente con i loro grafici di densità. Da questi grafici potrai analizzare facilmente e individuare l'insieme di dati che ha la distribuzione più simile rispetto all'insieme di dati originale. Potrai anche vedere come un'imputazione possa introdurre bias.
In questo esercizio confronterai i grafici di densità dei DataFrame imputati per diabetes che hai creato in precedenza.
I DataFrame diabetes_cc, diabetes_mean_imputed, diabetes_knn_imputed e diabetes_mice_imputed sono già stati caricati per te, insieme a matplotlib.pyplot come plt.
Questo esercizio fa parte del corso
Gestire i dati mancanti in Python
Istruzioni dell'esercizio
- Disegna un grafico di densità per la colonna
'Skin_Fold'per ciascun DataFrame. - Imposta le etichette usando la lista
labels. - Imposta l'etichetta per l'asse x su
'Skin Fold'.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Plot graphs of imputed DataFrames and the complete case
diabetes_cc['___'].___(___='___', c='red', linewidth=3)
diabetes_mean_imputed['___'].plot(___='___')
diabetes_knn_imputed['___'].plot(___='___')
diabetes_mice_imputed['___'].plot(___='___')
# Create labels for the four DataFrames
labels = ['Baseline (Complete Case)', 'Mean Imputation', 'KNN Imputation', 'MICE Imputation']
plt.legend(___)
# Set the x-label as Skin Fold
plt.xlabel('___')
plt.show()