or
Bu egzersiz, kursun bir parçasıdır
Bu bölümde, sayısal ve görsel özetlerin veride olağan dışı noktalar olup olmadığını gayriresmî olarak değerlendirmek için nasıl kullanılabileceğini öğreneceksin. Bir noktanın aykırı değer olup olmadığını kontrol etmek için Grubbs testi adı verilen istatistiksel bir yöntemi kullanacak ve veriler zaman serisi olduğunda aykırı değerleri belirlemeye yardımcı olabilen Mevsimsel-Hibrit ESD algoritmasını öğreneceksin.
Bu bölümde, veride birden çok özellik olduğunda her veri noktası için sürekli anomali puanları oluşturmakta kullanılan k-en yakın komşu uzaklığını ve local outlier factor’ü nasıl hesaplayacağını öğreneceksin. Ayrıca yerel ve küresel anomaliler arasındaki farkı ve her iki durumda da bu iki algoritmanın nasıl yardımcı olabileceğini öğreneceksin.
k-en yakın komşu uzaklığı ve local outlier factor, her noktayı puanlamak için en yakın komşuların uzaklığını veya göreli yoğunluğunu kullanır. Bu bölümde, isolation forest olarak adlandırılan alternatif bir ağaç tabanlı yaklaşımı inceleyeceksin; bu, veriyi giderek daha küçük bölgelere rastgele bölerek noktaların ne kadar kolay ayrılabildiğini ölçen, hızlı ve sağlam bir anomali tespit yöntemidir.
Artık anomali puanlama için birkaç farklı algoritmayla tanıştın. Bu son bölümde, etiketli anomalilerin mevcut olduğu durumlarda algoritmaların tespit performansını karşılaştırmayı öğreneceksin. Bir anomali puanı için precision ve recall istatistiklerini nasıl hesaplayıp yorumlayacağını ve algoritmaları kategorik özellik içeren verileri de kapsayacak şekilde nasıl uyarlayacağını öğreneceksin.
Geçerli egzersiz