BaşlayınÜcretsiz başlayın

En iyi sürekli dağılımdan örnekleme

İyi uyan bir olasılık dağılımından rastgele örnekleme, mahremiyeti korumaya yardımcı olur. Aynı zamanda, yetkili kişilerin veri üzerinde doğru bir istatistiksel analiz yapmasına imkan tanır.

Bu egzersizde, IBM veri kümesindeki monthly_income sütununu anonimleştireceksin. Önceki derste, en iyi uyum sağlayanın sürekli exponnorm dağılımı olduğunu belirlemiştin. Gelirleri modellemek için bunu kullan.

Veri kümesi hr olarak mevcut.

Bu egzersiz, kursun bir parçasıdır

Python ile Veri Gizliliği ve Anonimleştirme

Kursa Göz Atın

Egzersiz talimatları

  • scipy paketinden stats modülünü içe aktar.
  • Dağılımın parametrelerini elde etmek ve sonrasında örnek üretmek için sürekli monthly_income değişkenine exponnorm dağılımını uydur.
  • exponnorm dağılımından örnekle ve .rvs() metodunu kullanarak monthly_income değerlerinin yerine yaz. Boyutu, sütunun uzunluğuyla aynı olacak şekilde belirt.
  • Maaşları en yakın tam sayıya yuvarla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import stats from scipy
____

# Fit the exponnorm distribution to the continuous variable monthly income
params = ____

# Sample from the exponnorm distribution and replace monthly income
hr['monthly_income'] = ____

# Round the salaries to their closest integer
hr['monthly_income'] = ____

# See the resulting dataset
print(hr.head())
Kodu Düzenle ve Çalıştır