Pengelompokan K-means

Algoritma pengelompokan yang sangat umum digunakan adalah K-means clustering. Untuk deteksi kecurangan, K-means mudah diimplementasikan dan cukup kuat dalam memprediksi kasus-kasus mencurigakan. Ini adalah algoritma yang baik untuk memulai saat menangani masalah deteksi kecurangan. Namun, data kecurangan sering kali sangat besar, khususnya saat Anda bekerja dengan data transaksi. MiniBatch K-means adalah cara yang efisien untuk menerapkan K-means pada himpunan data yang besar, yang akan Anda gunakan dalam latihan ini.

Data yang telah diskalakan dari latihan sebelumnya, X_scaled, telah tersedia. Mari kita coba.

Latihan ini merupakan bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Instruksi latihan

Impor MiniBatchKMeans dari sklearn.
Inisialisasi model minibatch kmeans dengan 8 klaster.
Latih model pada data yang telah diskalakan Anda.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import MiniBatchKmeans 
from sklearn.cluster import ____

# Define the model 
kmeans = ____(n_clusters=____, random_state=0)

# Fit the model to the scaled data
kmeans.____(____)

Edit dan Jalankan Kode