MulaiMulai sekarang secara gratis

Memilih contamination

Walaupun implementasi kodenya hanya membutuhkan beberapa baris, mencari nilai contamination yang sesuai memerlukan perhatian.

Ingat bahwa parameter contamination hanya memengaruhi hasil IForest. Setelah IForest menghasilkan skor anomali mentah, contamination digunakan untuk memilih n% skor anomali teratas sebagai outlier. Misalnya, contamination 5% akan memilih observasi dengan 5% skor anomali tertinggi sebagai outlier.

Meskipun beberapa metode penyetelan akan dibahas dalam video berikutnya, untuk saat ini Anda akan berlatih menetapkan nilai sewenang-wenang pada parameter tersebut.

Data telah dimuat sebagai big_mart.

Latihan ini adalah bagian dari kursus

Deteksi Anomali dengan Python

Lihat Kursus

Petunjuk latihan

  • Instansiasi estimator IForest() dengan contamination sebesar 5%.
  • Lakukan fit pada instance tersebut ke data penjualan Big Mart.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

from pyod.models.iforest import IForest

# Instantiate an instance with 5% contamination
iforest = ____

# Fit IForest to Big Mart sales data
____
Edit dan Jalankan Kode