KNN dengan probabilitas pencilan
Karena kita tidak dapat sepenuhnya memercayai keluaran saat menggunakan contamination, mari periksa ulang pekerjaan kita menggunakan probabilitas pencilan. Nilai ini lebih dapat diandalkan.
Himpunan data telah dimuat sebagai females dan estimator KNN juga sudah diimpor.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Petunjuk latihan
- Bentuk instance
KNNdengan 20 tetangga. - Hitung probabilitas pencilan.
- Buat mask boolean yang menghasilkan nilai true ketika probabilitas pencilan di atas 55%.
- Gunakan
is_outlieruntuk memfilter pencilan darifemales.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Instantiate a KNN with 20 neighbors and fit to `females`
knn = ____
knn.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))