Menjelajah data dengan privacy budget accountant
Sistem eksplorasi data yang menyediakan differential privacy harus mengelola anggaran privasi yang mengukur jumlah privasi yang hilang di berbagai kueri.
Dalam latihan ini, Anda akan mengeksplorasi himpunan data IBM HR Analytics Employee Attrition & Performance sambil melacak anggaran privasi. Ingat bahwa jika sebuah kueri melampaui anggaran privasi yang ditetapkan di accountant, akan muncul galat.
Histogram adalah alat yang berharga untuk memvisualisasikan data secara diferensial privat. Sintaksnya sama dengan fungsi terkait di numpy, dengan parameter epsilon.
Himpunan data lengkap tersedia sebagai hr dan atribut usia karyawan sebagai ages. Sebuah fungsi kustom telah dibuat dan dimuat sebagai show_histogram() untuk memplot histogram seperti yang telah Anda lakukan sebelumnya dalam kursus.
Latihan ini adalah bagian dari kursus
Privasi Data dan Anonimisasi di Python
Petunjuk latihan
- Buat
BudgetAccountantprivasi denganepsilonsebesar1.5, menggunakan konstruktornya. - Hasilkan histogram privat dari kolom
agesdengan nilaiepsilonsebesar0.1. - Ambil dan tampilkan rata-rata privat dari
ages, menggunakanepsilonsebesar0.9, dan bounds dari10hingga100sebagai tuple. - Cetak sisa anggaran privasi untuk dua kueri baru berikutnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the privacy Budget Accountant with epsilon of 1.5
acc = ____
# Use the Budget Accountant acc to draw a private histogram of ages with epsilon 0.1
dp_hist, dp_bins = tools.___(____, epsilon=____, range=[10,100], accountant=____)
show_histogram(dp_hist, dp_bins)
# Get and show the private average of the age variable
print("Mean: ", tools.mean(____))
# Show privacy budget remaining for 2 queries
print("Remaining budget for 2 queries: ", ____)
print("Number of queries recorded: ", len(acc))