MulaiMulai sekarang secara gratis

Menilai klaster terkecil

Dalam latihan ini, Anda akan meninjau klaster yang dihasilkan oleh DBSCAN dan menandai klaster tertentu sebagai kecurangan (fraud):

  • pertama, Anda perlu mengetahui seberapa besar masing-masing klaster, lalu saring yang paling kecil
  • kemudian, ambil yang paling kecil dan tandai sebagai fraud
  • terakhir, bandingkan dengan label asli untuk melihat apakah cara ini benar-benar bagus dalam mendeteksi fraud.

Tersedia prediksi model DBSCAN, sehingga n_clusters tersedia serta label klaster yang disimpan pada pred_labels. Mari kita coba!

Latihan ini adalah bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])

# Print the result
print(counts)
Edit dan Jalankan Kode