Histogramas com privacidade diferencial
Neste exercício, você vai acessar o conjunto de dados Heart Failure Prediction seguindo a abordagem de privacidade diferencial. Você vai gerar e analisar histogramas privados e não privados e compará-los.
O foco serão os histogramas da variável age do conjunto de dados. Embora você possa acessar o DataFrame intacto no console, na prática, você não o compartilharia sem adicionar ruído aleatório calculado por privacidade diferencial, seguindo a abordagem global.
O DataFrame foi carregado como heart_df, enquanto a Series com os valores de age está armazenada em ages. tools de diffprivlib já foi importado.
Este exercício faz parte do curso
Privacidade de Dados e Anonimização em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Get counts and bars for non-private histogram of ages
counts, bins = ____
# Normalize counts to get proportions
proportions = ____
# Draw the histogram of proportions
plt.bar(____[: - 1], height=____, width=(bins[1] - bins[0]))
plt.show()