BaşlayınÜcretsiz Başlayın

Gizlilik bütçesi muhasebecisiyle veriyi keşfetme

Diferansiyel gizlilik sağlayan veri keşif sistemleri, birden çok sorgu boyunca kaybedilen gizliliği ölçen bir gizlilik bütçesini yönetmelidir.

Bu egzersizde, gizlilik bütçesini takip ederken IBM HR Analytics Employee Attrition & Performance veri kümesini keşfedeceksin. Unutma: Bir sorgu, muhasebecide belirtilen gizlilik bütçesini aşarsa bir hata oluşur.

Histogram, veriyi diferansiyel olarak gizli bir şekilde görselleştirmek için değerli bir araçtır. Sözdizimi, numpy içindeki karşılık gelen işleve benzerdir ve bir epsilon parametresi içerir.

Tam veri kümesi hr olarak, çalışanların yaş özelliği ise ages olarak mevcuttur. Histogramı, kursta daha önce yaptığın gibi çizdirmek için show_histogram() adında özel bir fonksiyon oluşturulup yüklendi.

Bu egzersiz

Python ile Veri Gizliliği ve Anonimleştirme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Kurucusunu kullanarak epsilon değeri 1.5 olan bir BudgetAccountant oluştur.
  • ages sütunundan epsilon değeri 0.1 olan özel (private) bir histogram üret.
  • ages için epsilon olarak 0.9 kullanarak ve alt-üst sınırları 10 ile 100 olacak şekilde bir demet (tuple) vererek özel ortalamayı al ve göster.
  • Sıradaki iki yeni sorgu için kalan gizlilik bütçesini yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create the privacy Budget Accountant with epsilon of 1.5
acc = ____

# Use the Budget Accountant acc to draw a private histogram of ages with epsilon 0.1
dp_hist, dp_bins = tools.___(____, epsilon=____, range=[10,100], accountant=____)
show_histogram(dp_hist, dp_bins)

# Get and show the private average of the age variable
print("Mean: ", tools.mean(____))

# Show privacy budget remaining for 2 queries
print("Remaining budget for 2 queries: ", ____)
print("Number of queries recorded: ", len(acc))
Kodu Düzenle ve Çalıştır