Pengelompokan K-means
Algoritma pengelompokan yang sangat umum digunakan adalah K-means clustering. Untuk deteksi kecurangan, K-means mudah diimplementasikan dan cukup kuat dalam memprediksi kasus-kasus mencurigakan. Ini adalah algoritma yang baik untuk memulai saat menangani masalah deteksi kecurangan. Namun, data kecurangan sering kali sangat besar, khususnya saat Anda bekerja dengan data transaksi. MiniBatch K-means adalah cara yang efisien untuk menerapkan K-means pada himpunan data yang besar, yang akan Anda gunakan dalam latihan ini.
Data yang telah diskalakan dari latihan sebelumnya, X_scaled, telah tersedia. Mari kita coba.
Latihan ini merupakan bagian dari kursus
Deteksi Kecurangan di Python
Instruksi latihan
- Impor
MiniBatchKMeansdarisklearn. - Inisialisasi model minibatch kmeans dengan 8 klaster.
- Latih model pada data yang telah diskalakan Anda.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import MiniBatchKmeans
from sklearn.cluster import ____
# Define the model
kmeans = ____(n_clusters=____, random_state=0)
# Fit the model to the scaled data
kmeans.____(____)