BaşlayınÜcretsiz Başlayın

En iyi sürekli dağılımdan örnekleme

İyi uyan bir olasılık dağılımından rastgele örnekleme, mahremiyeti korumaya yardımcı olur. Aynı zamanda, yetkili kişilerin veri üzerinde doğru bir istatistiksel analiz yapmasına imkan tanır.

Bu egzersizde, IBM veri kümesindeki monthly_income sütununu anonimleştireceksin. Önceki derste, en iyi uyum sağlayanın sürekli exponnorm dağılımı olduğunu belirlemiştin. Gelirleri modellemek için bunu kullan.

Veri kümesi hr olarak mevcut.

Bu egzersiz

Python ile Veri Gizliliği ve Anonimleştirme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • scipy paketinden stats modülünü içe aktar.
  • Dağılımın parametrelerini elde etmek ve sonrasında örnek üretmek için sürekli monthly_income değişkenine exponnorm dağılımını uydur.
  • exponnorm dağılımından örnekle ve .rvs() metodunu kullanarak monthly_income değerlerinin yerine yaz. Boyutu, sütunun uzunluğuyla aynı olacak şekilde belirt.
  • Maaşları en yakın tam sayıya yuvarla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import stats from scipy
____

# Fit the exponnorm distribution to the continuous variable monthly income
params = ____

# Sample from the exponnorm distribution and replace monthly income
hr['monthly_income'] = ____

# Round the salaries to their closest integer
hr['monthly_income'] = ____

# See the resulting dataset
print(hr.head())
Kodu Düzenle ve Çalıştır