MulaiMulai sekarang secara gratis

Menggunakan probabilitas outlier

Alternatif untuk mengisolasi outlier dengan contamination adalah menggunakan probabilitas outlier. Kelebihan utama metode ini adalah Anda dapat memilih ambang probabilitas secara bebas, yang berarti Anda bisa menentukan tingkat keyakinan prediksi sesuai kebutuhan.

IForest dan big_mart sudah dimuat.

Latihan ini adalah bagian dari kursus

Deteksi Anomali dengan Python

Lihat Kursus

Petunjuk latihan

  • Hitung probabilitas untuk inlier dan outlier.
  • Ambil probabilitas untuk outlier ke dalam outlier_probs.
  • Saring outlier ke dalam outliers dengan menggunakan ambang 70% pada outlier_probs.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

iforest = IForest(random_state=10).fit(big_mart)

# Calculate probabilities
probs = iforest.____

# Extract the probabilities for outliers
outlier_probs = ____[____]

# Filter for when the probability is higher than 70%
outliers = ____[____]

print(len(outliers))
Edit dan Jalankan Kode