Tidak semua metrik sepakat
Pada latihan sebelumnya Anda melihat bahwa tidak semua metrik sepakat dalam mengidentifikasi tetangga terdekat. Apakah ini berarti mereka juga bisa berbeda pendapat soal outlier? Anda memutuskan untuk mengujinya. Anda menggunakan data yang sama seperti sebelumnya, tetapi kali ini memasukkannya ke detektor outlier Local Outlier Factor. Modul LocalOutlierFactor telah disediakan untuk Anda sebagai lof, dan datanya tersedia sebagai features.
Latihan ini adalah bagian dari kursus
Merancang Alur Kerja Machine Learning di Python
Petunjuk latihan
- Deteksi outlier dalam
featuresmenggunakan metrikeuclidean. - Deteksi outlier dalam
featuresmenggunakan metrikhamming. - Deteksi outlier dalam
featuresmenggunakan metrikjaccard. - Cari apakah ketiga metrik tersebut sepakat pada satu outlier mana pun.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Compute outliers according to the euclidean metric
out_eucl = ____(metric='euclidean').fit_predict(features)
# Compute outliers according to the hamming metric
out_hamm = ____(metric=____).fit_predict(features)
# Compute outliers according to the jaccard metric
out_jacc = ____(____=____).____(features)
# Find if the metrics agree on any one datapoint
print(any(____ + ____ + ____ == ____))