Menggunakan probabilitas outlier
Alternatif untuk mengisolasi outlier dengan contamination adalah menggunakan probabilitas outlier. Kelebihan utama metode ini adalah Anda dapat memilih ambang probabilitas secara bebas, yang berarti Anda bisa menentukan tingkat keyakinan prediksi sesuai kebutuhan.
IForest dan big_mart sudah dimuat.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Petunjuk latihan
- Hitung probabilitas untuk inlier dan outlier.
- Ambil probabilitas untuk outlier ke dalam
outlier_probs. - Saring outlier ke dalam
outliersdengan menggunakan ambang 70% padaoutlier_probs.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
iforest = IForest(random_state=10).fit(big_mart)
# Calculate probabilities
probs = iforest.____
# Extract the probabilities for outliers
outlier_probs = ____[____]
# Filter for when the probability is higher than 70%
outliers = ____[____]
print(len(outliers))