BaşlayınÜcretsiz Başlayın

Maaş tahmini

Bu egzersizde, nüfus sayımı gelir veri kümesini kullanarak bireylerin yıllık maaşlarının 50.000 $'dan fazla olup olmadığını tahmin edeceksin.

Unutma: Ek gizlilik kaybını veya bilgi sızıntısını önlemek için özel modeli oluştururken sınırları bir parametre olarak belirtmelisin. Genellikle bu sınırları veriden bağımsız şekilde, alan bilgisini kullanarak belirleyebilir ya da bir DP histogramıyla arayabilirsin.

Veri kümesi X_train, y_train, X_test ve y_test olarak yüklendi ve bölündü. Sınıflandırıcı dp_GaussianNB olarak hazır durumda.

Bu egzersiz

Python ile Veri Gizliliği ve Anonimleştirme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Modelin sınırlarını, eğitim verisindeki min ve max değerleri hesaplayıp verimizdeki 5 sütun için 5 ile 40 aralığında rastgele sayılar çıkarıp/ekleyerek gürültü eklemek suretiyle ayarla.
  • 0.5 epsilon ve az önce oluşturduğun sınırlar ile bir dp_GaussianNB sınıflandırıcısı oluştur.
  • Modeli veriye fit et ve skoru gör.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Set the min and max of bounds for the data and add noise using random
bounds = (X_train.____(axis=0) - random.____(range(5, 40), 5), 
          ____)

# Built the classifier with epsilon of 0.5
dp_clf = ____(epsilon=____, bounds=____)

# Fit the model to the data and print the score
____
print("The accuracy of the differentially private model is ",
       dp_clf.score(X_test, y_test))
Kodu Düzenle ve Çalıştır