Pengelompokan K-means
Algoritma pengelompokan yang sangat umum digunakan adalah K-means clustering. Untuk deteksi kecurangan, K-means mudah diimplementasikan dan cukup kuat dalam memprediksi kasus-kasus mencurigakan. Ini adalah algoritma yang baik untuk memulai saat menangani masalah deteksi kecurangan. Namun, data kecurangan sering kali sangat besar, khususnya saat Anda bekerja dengan data transaksi. MiniBatch K-means adalah cara yang efisien untuk menerapkan K-means pada himpunan data yang besar, yang akan Anda gunakan dalam latihan ini.
Data yang telah diskalakan dari latihan sebelumnya, X_scaled, telah tersedia. Mari kita coba.
Latihan ini adalah bagian dari kursus
Deteksi Kecurangan di Python
Petunjuk latihan
- Impor
MiniBatchKMeansdarisklearn. - Inisialisasi model minibatch kmeans dengan 8 klaster.
- Latih model pada data yang telah diskalakan Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import MiniBatchKmeans
from sklearn.cluster import ____
# Define the model
kmeans = ____(n_clusters=____, random_state=0)
# Fit the model to the scaled data
kmeans.____(____)