Histogramme mit Differential Privacy
In dieser Übung greifst du nach dem differentially-private Ansatz auf den Heart Failure Prediction-Datensatz zu. Du erzeugst und analysierst private und nicht-private Histogramme und vergleichst sie miteinander.
Du konzentrierst dich auf Histogramme der Variable age im Datensatz. Auch wenn du im Terminal auf das unveränderte DataFrame zugreifen kannst, würdest du es in der Praxis nicht ohne das Hinzufügen von zufälligem, per Differential Privacy berechnetem Rauschen weitergeben (globaler Ansatz).
Das DataFrame ist als heart_df geladen, während die Series mit den Werten aus age als ages gespeichert ist. tools aus diffprivlib ist bereits importiert.
Diese Übung ist Teil des Kurses
Datenschutz und Anonymisierung mit Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Get counts and bars for non-private histogram of ages
counts, bins = ____
# Normalize counts to get proportions
proportions = ____
# Draw the histogram of proportions
plt.bar(____[: - 1], height=____, width=(bins[1] - bins[0]))
plt.show()