Gizlilik bütçesi muhasebecisiyle veriyi keşfetme
Diferansiyel gizlilik sağlayan veri keşif sistemleri, birden çok sorgu boyunca kaybedilen gizliliği ölçen bir gizlilik bütçesini yönetmelidir.
Bu egzersizde, gizlilik bütçesini takip ederken IBM HR Analytics Employee Attrition & Performance veri kümesini keşfedeceksin. Unutma: Bir sorgu, muhasebecide belirtilen gizlilik bütçesini aşarsa bir hata oluşur.
Histogram, veriyi diferansiyel olarak gizli bir şekilde görselleştirmek için değerli bir araçtır. Sözdizimi, numpy içindeki karşılık gelen işleve benzerdir ve bir epsilon parametresi içerir.
Tam veri kümesi hr olarak, çalışanların yaş özelliği ise ages olarak mevcuttur. Histogramı, kursta daha önce yaptığın gibi çizdirmek için show_histogram() adında özel bir fonksiyon oluşturulup yüklendi.
Bu egzersiz
Python ile Veri Gizliliği ve Anonimleştirme
kursunun bir parçasıdırEgzersiz talimatları
- Kurucusunu kullanarak
epsilondeğeri1.5olan birBudgetAccountantoluştur. agessütunundanepsilondeğeri0.1olan özel (private) bir histogram üret.agesiçinepsilonolarak0.9kullanarak ve alt-üst sınırları10ile100olacak şekilde bir demet (tuple) vererek özel ortalamayı al ve göster.- Sıradaki iki yeni sorgu için kalan gizlilik bütçesini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create the privacy Budget Accountant with epsilon of 1.5
acc = ____
# Use the Budget Accountant acc to draw a private histogram of ages with epsilon 0.1
dp_hist, dp_bins = tools.___(____, epsilon=____, range=[10,100], accountant=____)
show_histogram(dp_hist, dp_bins)
# Get and show the private average of the age variable
print("Mean: ", tools.mean(____))
# Show privacy budget remaining for 2 queries
print("Remaining budget for 2 queries: ", ____)
print("Number of queries recorded: ", len(acc))