Menggunakan probabilitas outlier
Alternatif untuk mengisolasi outlier dengan contamination adalah menggunakan probabilitas outlier. Kelebihan utama metode ini adalah Anda dapat memilih ambang probabilitas secara bebas, yang berarti Anda bisa menentukan tingkat keyakinan prediksi sesuai kebutuhan.
IForest dan big_mart sudah dimuat.
Latihan ini merupakan bagian dari kursus
Deteksi Anomali dengan Python
Instruksi latihan
- Hitung probabilitas untuk inlier dan outlier.
- Ambil probabilitas untuk outlier ke dalam
outlier_probs. - Saring outlier ke dalam
outliersdengan menggunakan ambang 70% padaoutlier_probs.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
iforest = IForest(random_state=10).fit(big_mart)
# Calculate probabilities
probs = iforest.____
# Extract the probabilities for outliers
outlier_probs = ____[____]
# Filter for when the probability is higher than 70%
outliers = ____[____]
print(len(outliers))