Memilih contamination
Walaupun implementasi kodenya hanya membutuhkan beberapa baris, mencari nilai contamination yang sesuai memerlukan perhatian.
Ingat bahwa parameter contamination hanya memengaruhi hasil IForest. Setelah IForest menghasilkan skor anomali mentah, contamination digunakan untuk memilih n% skor anomali teratas sebagai outlier. Misalnya, contamination 5% akan memilih observasi dengan 5% skor anomali tertinggi sebagai outlier.
Meskipun beberapa metode penyetelan akan dibahas dalam video berikutnya, untuk saat ini Anda akan berlatih menetapkan nilai sewenang-wenang pada parameter tersebut.
Data telah dimuat sebagai big_mart.
Latihan ini merupakan bagian dari kursus
Deteksi Anomali dengan Python
Instruksi latihan
- Instansiasi estimator
IForest()dengancontaminationsebesar 5%. - Lakukan fit pada instance tersebut ke data penjualan Big Mart.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
from pyod.models.iforest import IForest
# Instantiate an instance with 5% contamination
iforest = ____
# Fit IForest to Big Mart sales data
____