Comparando gráficos de densidade
As diferentes imputações que você realizou anteriormente podem ser comparadas graficamente por meio de seus gráficos de densidade. A partir desses gráficos, você consegue analisar e encontrar o conjunto de dados cuja distribuição é mais semelhante à do conjunto original. Você também poderá ver como uma imputação pode introduzir viés.
Neste exercício, você vai comparar os gráficos de densidade dos DataFrames imputados de diabetes que você criou antes.
Os DataFrames diabetes_cc, diabetes_mean_imputed, diabetes_knn_imputed e diabetes_mice_imputed já foram carregados para você usar, junto com matplotlib.pyplot como plt.
Este exercício faz parte do curso
Lidando com Dados Ausentes em Python
Instruções do exercício
- Trace um gráfico de densidade para a coluna
'Skin_Fold'de cada DataFrame. - Defina os rótulos usando a lista
labels. - Defina o rótulo do eixo x como
'Skin Fold'.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot graphs of imputed DataFrames and the complete case
diabetes_cc['___'].___(___='___', c='red', linewidth=3)
diabetes_mean_imputed['___'].plot(___='___')
diabetes_knn_imputed['___'].plot(___='___')
diabetes_mice_imputed['___'].plot(___='___')
# Create labels for the four DataFrames
labels = ['Baseline (Complete Case)', 'Mean Imputation', 'KNN Imputation', 'MICE Imputation']
plt.legend(___)
# Set the x-label as Skin Fold
plt.xlabel('___')
plt.show()