LOF dengan probabilitas outlier
Seperti biasa, periksa kembali bahwa tingkat kontaminasi yang dipilih dapat dipercaya dengan memfilter outlier menggunakan ambang probabilitas. Sintaksnya sama seperti pada KNN.
Estimator LOF sudah diimpor, dan himpunan data females_transformed juga tersedia.
Latihan ini merupakan bagian dari kursus
Deteksi Anomali dengan Python
Instruksi latihan
- Instansiasikan
LOF()dengan 20 tetangga. - Hitung probabilitas outlier ke dalam
probs. - Buat mask boolean bernama
is_outlieryang bernilai true ketika probabilitas outlier di atas 50%. - Gunakan
is_outlieruntuk memfilter outlier darifemales_transformed.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Instantiate an LOF with 20 neighbors and fit to the data
lof = ____
lof.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))