MulaiMulai sekarang secara gratis

Menjelajah data dengan privacy budget accountant

Sistem eksplorasi data yang menyediakan differential privacy harus mengelola anggaran privasi yang mengukur jumlah privasi yang hilang di berbagai kueri.

Dalam latihan ini, Anda akan mengeksplorasi himpunan data IBM HR Analytics Employee Attrition & Performance sambil melacak anggaran privasi. Ingat bahwa jika sebuah kueri melampaui anggaran privasi yang ditetapkan di accountant, akan muncul galat.

Histogram adalah alat yang berharga untuk memvisualisasikan data secara diferensial privat. Sintaksnya sama dengan fungsi terkait di numpy, dengan parameter epsilon.

Himpunan data lengkap tersedia sebagai hr dan atribut usia karyawan sebagai ages. Sebuah fungsi kustom telah dibuat dan dimuat sebagai show_histogram() untuk memplot histogram seperti yang telah Anda lakukan sebelumnya dalam kursus.

Latihan ini adalah bagian dari kursus

Privasi Data dan Anonimisasi di Python

Lihat Kursus

Petunjuk latihan

  • Buat BudgetAccountant privasi dengan epsilon sebesar 1.5, menggunakan konstruktornya.
  • Hasilkan histogram privat dari kolom ages dengan nilai epsilon sebesar 0.1.
  • Ambil dan tampilkan rata-rata privat dari ages, menggunakan epsilon sebesar 0.9, dan bounds dari 10 hingga 100 sebagai tuple.
  • Cetak sisa anggaran privasi untuk dua kueri baru berikutnya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create the privacy Budget Accountant with epsilon of 1.5
acc = ____

# Use the Budget Accountant acc to draw a private histogram of ages with epsilon 0.1
dp_hist, dp_bins = tools.___(____, epsilon=____, range=[10,100], accountant=____)
show_histogram(dp_hist, dp_bins)

# Get and show the private average of the age variable
print("Mean: ", tools.mean(____))

# Show privacy budget remaining for 2 queries
print("Remaining budget for 2 queries: ", ____)
print("Number of queries recorded: ", len(acc))
Edit dan Jalankan Kode