Menemukan pencilan dengan z-score
Distribusi normal sangat umum di dunia nyata dan merupakan distribusi yang paling sering ditemui. Karena itu, metode z-score bisa menjadi salah satu cara tercepat untuk mendeteksi pencilan.
Ingat aturan praktis dari video: jika sebuah sampel lebih dari tiga simpangan baku dari mean, Anda dapat menganggapnya sebagai nilai ekstrem.
Namun, ingat juga bahwa metode z-score harus digunakan dengan hati-hati. Metode ini hanya tepat ketika kita yakin data berasal dari distribusi normal. Jika tidak, hasilnya bisa menyesatkan.
Distribusi prices telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Petunjuk latihan
- Impor fungsi
zscoredari modulscipyyang relevan. - Temukan z-score dari
pricesdan simpan ke dalamscores. - Buat mask boolean bernama
is_over_3untuk memeriksa apakah nilai absolutscoreslebih besar dari 3. - Gunakan mask tersebut untuk memfilter
pricesguna mendapatkan pencilan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the zscores function
from scipy.____ import ____
# Find the zscores of prices
scores = ____(____)
# Check if the absolute values of scores are over 3
is_over_3 = ____
# Use the mask to subset prices
outliers = ____[____]
print(len(outliers))