Metode Elbow

Pada latihan sebelumnya Anda telah mengimplementasikan MiniBatch K-means dengan 8 klaster, tanpa benar-benar memeriksa berapa jumlah klaster yang tepat. Untuk pendekatan deteksi kecurangan pertama kita, penting untuk menentukan jumlah klaster dengan benar, terutama ketika Anda ingin menggunakan pencilan dari klaster tersebut sebagai prediksi kecurangan. Untuk memutuskan jumlah klaster yang akan digunakan, mari terapkan metode Elbow dan lihat berapa jumlah klaster optimal berdasarkan metode ini.

X_scaled kembali tersedia untuk Anda gunakan dan MiniBatchKMeans telah diimpor dari sklearn.

Latihan ini merupakan bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Instruksi latihan

Tentukan rentang antara 1 hingga 5 klaster.
Jalankan MiniBatch K-means pada semua klaster dalam rentang tersebut menggunakan list comprehension.
Latih setiap model pada data yang telah diskalakan dan peroleh skornya dari data yang telah diskalakan.
Plot nomor klaster dan skor masing-masing; proses ini akan memakan waktu beberapa detik.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Define the range of clusters to try
clustno = range(____, ____)

# Run MiniBatch Kmeans over the number of clusters
kmeans = [____(n_clusters=i, random_state=0) for ____ in ____]

# Obtain the score for each model
score = [kmeans[i].fit(____).score(____) for i in range(len(kmeans))]

# Plot the models and their respective score 
plt.plot(____, ____)
plt.xlabel('Number of Clusters')
plt.ylabel('Score')
plt.title('Elbow Curve')
plt.show()

Edit dan Jalankan Kode