Menilai klaster terkecil
Dalam latihan ini, Anda akan meninjau klaster yang dihasilkan oleh DBSCAN dan menandai klaster tertentu sebagai kecurangan (fraud):
- pertama, Anda perlu mengetahui seberapa besar masing-masing klaster, lalu saring yang paling kecil
- kemudian, ambil yang paling kecil dan tandai sebagai fraud
- terakhir, bandingkan dengan label asli untuk melihat apakah cara ini benar-benar bagus dalam mendeteksi fraud.
Tersedia prediksi model DBSCAN, sehingga n_clusters tersedia serta label klaster yang disimpan pada pred_labels. Mari kita coba!
Latihan ini adalah bagian dari kursus
Deteksi Kecurangan di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])
# Print the result
print(counts)