MulaiMulai sekarang secara gratis

Pengelompokan K-means

Algoritma pengelompokan yang sangat umum digunakan adalah K-means clustering. Untuk deteksi kecurangan, K-means mudah diimplementasikan dan cukup kuat dalam memprediksi kasus-kasus mencurigakan. Ini adalah algoritma yang baik untuk memulai saat menangani masalah deteksi kecurangan. Namun, data kecurangan sering kali sangat besar, khususnya saat Anda bekerja dengan data transaksi. MiniBatch K-means adalah cara yang efisien untuk menerapkan K-means pada himpunan data yang besar, yang akan Anda gunakan dalam latihan ini.

Data yang telah diskalakan dari latihan sebelumnya, X_scaled, telah tersedia. Mari kita coba.

Latihan ini adalah bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Petunjuk latihan

  • Impor MiniBatchKMeans dari sklearn.
  • Inisialisasi model minibatch kmeans dengan 8 klaster.
  • Latih model pada data yang telah diskalakan Anda.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import MiniBatchKmeans 
from sklearn.cluster import ____

# Define the model 
kmeans = ____(n_clusters=____, random_state=0)

# Fit the model to the scaled data
kmeans.____(____)
Edit dan Jalankan Kode