LOF dengan probabilitas outlier
Seperti biasa, periksa kembali bahwa tingkat kontaminasi yang dipilih dapat dipercaya dengan memfilter outlier menggunakan ambang probabilitas. Sintaksnya sama seperti pada KNN.
Estimator LOF sudah diimpor, dan himpunan data females_transformed juga tersedia.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Petunjuk latihan
- Instansiasikan
LOF()dengan 20 tetangga. - Hitung probabilitas outlier ke dalam
probs. - Buat mask boolean bernama
is_outlieryang bernilai true ketika probabilitas outlier di atas 50%. - Gunakan
is_outlieruntuk memfilter outlier darifemales_transformed.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Instantiate an LOF with 20 neighbors and fit to the data
lof = ____
lof.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))