Aykırı değerleri winsorization ile ele al
İki değişkeni olan bir basetable veriliyor: "sum\_donations" ve "donor\_id". Bağışçılar olağanüstü tutarlarda bağış yaptığında "sum_donations" aykırı değerler içerebilir. Bu nedenle, bu değişkeni winsorize etmek istiyorsun: en yüksek %5'lik tutarların, üst %5 yüzdelik değerle değiştirilmesini hedefliyorsun.
Bu egzersiz
Python ile Orta Düzey Öngörüsel Analitik
kursunun bir parçasıdırEgzersiz talimatları
sum_donationsdeğişkeninin minimum değerini yazdır ve en az 0 olduğunu doğrula. Sonrasum_donations'ın maksimum değerini yazdır.- Uygun alt sınır yüzdelik değerini doldur. 0'dan büyük tüm değerler gerçekçi ve sık görüldüğü için, alt sınır yüzdelik değerinin altındaki değerleri değiştirmeye gerek yok.
- "sum_donations_winsorized" adlı, "sum_donations" değişkeninin winsorize edilmiş bir sürümü olan yeni bir değişken oluştur.
sum_donations_winsorized'ın maksimum değerini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
from scipy.stats.mstats import winsorize
# Check minimum sum of donations
print(____["____"].____())
print(____["____"].____())
# Fill out the lower limit
lower_limit = ____
# Winsorize the variable sum_donations
basetable["sum_donations_winsorized"] = ____(____["____"], limits=[lower_limit, 0.05])
# Check maximum sum of donations after winsorization
print(____["____"].____())