En iyi sürekli dağılımdan örnekleme
İyi uyan bir olasılık dağılımından rastgele örnekleme, mahremiyeti korumaya yardımcı olur. Aynı zamanda, yetkili kişilerin veri üzerinde doğru bir istatistiksel analiz yapmasına imkan tanır.
Bu egzersizde, IBM veri kümesindeki monthly_income sütununu anonimleştireceksin. Önceki derste, en iyi uyum sağlayanın sürekli exponnorm dağılımı olduğunu belirlemiştin. Gelirleri modellemek için bunu kullan.
Veri kümesi hr olarak mevcut.
Bu egzersiz
Python ile Veri Gizliliği ve Anonimleştirme
kursunun bir parçasıdırEgzersiz talimatları
scipypaketindenstatsmodülünü içe aktar.- Dağılımın parametrelerini elde etmek ve sonrasında örnek üretmek için sürekli
monthly_incomedeğişkenineexponnormdağılımını uydur. exponnormdağılımından örnekle ve.rvs()metodunu kullanarakmonthly_incomedeğerlerinin yerine yaz. Boyutu, sütunun uzunluğuyla aynı olacak şekilde belirt.- Maaşları en yakın tam sayıya yuvarla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import stats from scipy
____
# Fit the exponnorm distribution to the continuous variable monthly income
params = ____
# Sample from the exponnorm distribution and replace monthly income
hr['monthly_income'] = ____
# Round the salaries to their closest integer
hr['monthly_income'] = ____
# See the resulting dataset
print(hr.head())