z-skorlarıyla aykırı değer bulma
Normal dağılım doğada her yerde karşımıza çıkar ve en yaygın dağılımdır. Bu yüzden z-skoru yöntemi, aykırı değerleri tespit etmenin en hızlı yöntemlerinden biri olabilir.
Videodaki pratik kuralı hatırla: bir örneklem ortalamadan üç standart sapmadan daha uzaktaysa, onu aşırı bir değer olarak düşünebilirsin.
Ancak, z-skoru yöntemini temkinli kullanmak gerektiğini de unutma. Bu yöntem yalnızca verilerimizin normal dağılımdan geldiğinden emin olduğumuzda uygundur. Aksi halde sonuçlar yanıltıcı olabilir.
prices dağılımı senin için yüklendi.
Bu egzersiz
Python ile Anomali Tespiti
kursunun bir parçasıdırEgzersiz talimatları
- İlgili
scipymodülündenzscorefonksiyonunu içe aktar. pricesiçin z-skorlarını hesapla vescoresdeğişkenine kaydet.scoresdeğerlerinin mutlak değeri 3’ten büyük mü diye kontrol edenis_over_3adlı bir mantıksal maske oluştur.- Aykırı değerleri bulmak için bu maskeyi kullanarak
prices’ı filtrele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the zscores function
from scipy.____ import ____
# Find the zscores of prices
scores = ____(____)
# Check if the absolute values of scores are over 3
is_over_3 = ____
# Use the mask to subset prices
outliers = ____[____]
print(len(outliers))