Aan de slagGa gratis aan de slag

Histogrammen met differential privacy

In deze oefening ga je de Heart Failure Prediction-gegevensset benaderen volgens de differentieel private aanpak. Je genereert en analyseert private en niet-private histogrammen en vergelijkt die met elkaar.

Je richt je op histogrammen van de variabele age in de gegevensset. Hoewel je in de console toegang hebt tot de ongewijzigde DataFrame, zou je die in de praktijk niet delen zonder willekeurige ruis toe te voegen die is berekend met differential privacy, volgens de globale aanpak.

De DataFrame is geladen als heart_df en de Series met de waarden van age is opgeslagen als ages. tools uit diffprivlib is al geïmporteerd.

Deze oefening maakt deel uit van de cursus

Dataprivacy en anonimisering in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Get counts and bars for non-private histogram of ages
counts, bins = ____

# Normalize counts to get proportions
proportions = ____

# Draw the histogram of proportions
plt.bar(____[: - 1], height=____, width=(bins[1] - bins[0]))
plt.show()
Code bewerken en uitvoeren