BaşlayınÜcretsiz Başlayın

Aykırı değerleri winsorization ile ele al

İki değişkeni olan bir basetable veriliyor: "sum\_donations" ve "donor\_id". Bağışçılar olağanüstü tutarlarda bağış yaptığında "sum_donations" aykırı değerler içerebilir. Bu nedenle, bu değişkeni winsorize etmek istiyorsun: en yüksek %5'lik tutarların, üst %5 yüzdelik değerle değiştirilmesini hedefliyorsun.

Bu egzersiz

Python ile Orta Düzey Öngörüsel Analitik

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • sum_donations değişkeninin minimum değerini yazdır ve en az 0 olduğunu doğrula. Sonra sum_donations'ın maksimum değerini yazdır.
  • Uygun alt sınır yüzdelik değerini doldur. 0'dan büyük tüm değerler gerçekçi ve sık görüldüğü için, alt sınır yüzdelik değerinin altındaki değerleri değiştirmeye gerek yok.
  • "sum_donations_winsorized" adlı, "sum_donations" değişkeninin winsorize edilmiş bir sürümü olan yeni bir değişken oluştur.
  • sum_donations_winsorized'ın maksimum değerini yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

from scipy.stats.mstats import winsorize

# Check minimum sum of donations
print(____["____"].____())
print(____["____"].____())

# Fill out the lower limit
lower_limit = ____

# Winsorize the variable sum_donations
basetable["sum_donations_winsorized"] = ____(____["____"], limits=[lower_limit, 0.05])

# Check maximum sum of donations after winsorization
print(____["____"].____())
Kodu Düzenle ve Çalıştır