MulaiMulai sekarang secara gratis

Menemukan pencilan dengan z-score

Distribusi normal sangat umum di dunia nyata dan merupakan distribusi yang paling sering ditemui. Karena itu, metode z-score bisa menjadi salah satu cara tercepat untuk mendeteksi pencilan.

Ingat aturan praktis dari video: jika sebuah sampel lebih dari tiga simpangan baku dari mean, Anda dapat menganggapnya sebagai nilai ekstrem.

Namun, ingat juga bahwa metode z-score harus digunakan dengan hati-hati. Metode ini hanya tepat ketika kita yakin data berasal dari distribusi normal. Jika tidak, hasilnya bisa menyesatkan.

Distribusi prices telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Deteksi Anomali dengan Python

Lihat Kursus

Petunjuk latihan

  • Impor fungsi zscore dari modul scipy yang relevan.
  • Temukan z-score dari prices dan simpan ke dalam scores.
  • Buat mask boolean bernama is_over_3 untuk memeriksa apakah nilai absolut scores lebih besar dari 3.
  • Gunakan mask tersebut untuk memfilter prices guna mendapatkan pencilan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the zscores function
from scipy.____ import ____

# Find the zscores of prices
scores = ____(____)

# Check if the absolute values of scores are over 3
is_over_3 = ____

# Use the mask to subset prices
outliers = ____[____]

print(len(outliers))
Edit dan Jalankan Kode