BaşlayınÜcretsiz başlayın

Maaş tahmini

Bu egzersizde, nüfus sayımı gelir veri kümesini kullanarak bireylerin yıllık maaşlarının 50.000 $'dan fazla olup olmadığını tahmin edeceksin.

Unutma: Ek gizlilik kaybını veya bilgi sızıntısını önlemek için özel modeli oluştururken sınırları bir parametre olarak belirtmelisin. Genellikle bu sınırları veriden bağımsız şekilde, alan bilgisini kullanarak belirleyebilir ya da bir DP histogramıyla arayabilirsin.

Veri kümesi X_train, y_train, X_test ve y_test olarak yüklendi ve bölündü. Sınıflandırıcı dp_GaussianNB olarak hazır durumda.

Bu egzersiz, kursun bir parçasıdır

Python ile Veri Gizliliği ve Anonimleştirme

Kursa Göz Atın

Egzersiz talimatları

  • Modelin sınırlarını, eğitim verisindeki min ve max değerleri hesaplayıp verimizdeki 5 sütun için 5 ile 40 aralığında rastgele sayılar çıkarıp/ekleyerek gürültü eklemek suretiyle ayarla.
  • 0.5 epsilon ve az önce oluşturduğun sınırlar ile bir dp_GaussianNB sınıflandırıcısı oluştur.
  • Modeli veriye fit et ve skoru gör.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Set the min and max of bounds for the data and add noise using random
bounds = (X_train.____(axis=0) - random.____(range(5, 40), 5), 
          ____)

# Built the classifier with epsilon of 0.5
dp_clf = ____(epsilon=____, bounds=____)

# Fit the model to the data and print the score
____
print("The accuracy of the differentially private model is ",
       dp_clf.score(X_test, y_test))
Kodu Düzenle ve Çalıştır