Istogrammi con privacy differenziale
In questo esercizio accederai al dataset Heart Failure Prediction seguendo l’approccio a privacy differenziale. Genererai e analizzerai istogrammi privati e non privati e li confronterai.
Ti concentrerai sugli istogrammi della variabile age del dataset. Anche se nella console puoi accedere al DataFrame integro, nella realtà non lo condivideresti senza aggiungere rumore casuale calcolato con la privacy differenziale, seguendo l’approccio globale.
Il DataFrame è caricato come heart_df, mentre la Series con i valori di age è salvata come ages. tools da diffprivlib è già importato.
Questo esercizio fa parte del corso
Riservatezza dei dati e anonimizzazione in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Get counts and bars for non-private histogram of ages
counts, bins = ____
# Normalize counts to get proportions
proportions = ____
# Draw the histogram of proportions
plt.bar(____[: - 1], height=____, width=(bins[1] - bins[0]))
plt.show()