Histogram dengan differential privacy
Dalam latihan ini, Anda akan mengakses himpunan data Heart Failure Prediction menggunakan pendekatan differentially private. Anda akan membuat dan menganalisis histogram privat dan non-privat lalu membandingkannya.
Fokus Anda adalah pada histogram dari variabel age pada himpunan data. Meskipun Anda dapat mengakses DataFrame utuh di konsol, dalam praktik nyata, Anda tidak akan membagikannya tanpa menambahkan noise acak yang dihitung menggunakan differential privacy, mengikuti pendekatan global.
DataFrame dimuat sebagai heart_df, sedangkan Series yang berisi nilai dari age disimpan sebagai ages. tools dari diffprivlib sudah diimpor.
Latihan ini adalah bagian dari kursus
Privasi Data dan Anonimisasi di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get counts and bars for non-private histogram of ages
counts, bins = ____
# Normalize counts to get proportions
proportions = ____
# Draw the histogram of proportions
plt.bar(____[: - 1], height=____, width=(bins[1] - bins[0]))
plt.show()