CommencerCommencer gratuitement

Histogrammes avec confidentialité différentielle

Dans cet exercice, vous allez accéder au jeu de données Heart Failure Prediction en suivant l’approche de confidentialité différentielle. Vous allez générer et analyser des histogrammes privés et non privés, puis les comparer.

Vous vous concentrerez sur les histogrammes de la variable age du jeu de données. Même si vous pouvez accéder au DataFrame intact dans la console, dans la pratique, vous ne le partageriez pas sans y ajouter un bruit aléatoire calculé via la confidentialité différentielle, selon l’approche globale.

Le DataFrame est chargé sous le nom heart_df et la Series contenant les valeurs de age est stockée dans ages. tools de diffprivlib est déjà importé.

Cet exercice fait partie du cours

Confidentialité des données et anonymisation en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Get counts and bars for non-private histogram of ages
counts, bins = ____

# Normalize counts to get proportions
proportions = ____

# Draw the histogram of proportions
plt.bar(____[: - 1], height=____, width=(bins[1] - bins[0]))
plt.show()
Modifier et exécuter le code