Memilih contamination
Walaupun implementasi kodenya hanya membutuhkan beberapa baris, mencari nilai contamination yang sesuai memerlukan perhatian.
Ingat bahwa parameter contamination hanya memengaruhi hasil IForest. Setelah IForest menghasilkan skor anomali mentah, contamination digunakan untuk memilih n% skor anomali teratas sebagai outlier. Misalnya, contamination 5% akan memilih observasi dengan 5% skor anomali tertinggi sebagai outlier.
Meskipun beberapa metode penyetelan akan dibahas dalam video berikutnya, untuk saat ini Anda akan berlatih menetapkan nilai sewenang-wenang pada parameter tersebut.
Data telah dimuat sebagai big_mart.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Petunjuk latihan
- Instansiasi estimator
IForest()dengancontaminationsebesar 5%. - Lakukan fit pada instance tersebut ke data penjualan Big Mart.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from pyod.models.iforest import IForest
# Instantiate an instance with 5% contamination
iforest = ____
# Fit IForest to Big Mart sales data
____