Mulai sekarangMulai gratis

Memilih contamination

Walaupun implementasi kodenya hanya membutuhkan beberapa baris, mencari nilai contamination yang sesuai memerlukan perhatian.

Ingat bahwa parameter contamination hanya memengaruhi hasil IForest. Setelah IForest menghasilkan skor anomali mentah, contamination digunakan untuk memilih n% skor anomali teratas sebagai outlier. Misalnya, contamination 5% akan memilih observasi dengan 5% skor anomali tertinggi sebagai outlier.

Meskipun beberapa metode penyetelan akan dibahas dalam video berikutnya, untuk saat ini Anda akan berlatih menetapkan nilai sewenang-wenang pada parameter tersebut.

Data telah dimuat sebagai big_mart.

Latihan ini merupakan bagian dari kursus

Deteksi Anomali dengan Python

Lihat Kursus

Instruksi latihan

  • Instansiasi estimator IForest() dengan contamination sebesar 5%.
  • Lakukan fit pada instance tersebut ke data penjualan Big Mart.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

from pyod.models.iforest import IForest

# Instantiate an instance with 5% contamination
iforest = ____

# Fit IForest to Big Mart sales data
____
Edit dan Jalankan Kode