Metode Elbow
Pada latihan sebelumnya Anda telah mengimplementasikan MiniBatch K-means dengan 8 klaster, tanpa benar-benar memeriksa berapa jumlah klaster yang tepat. Untuk pendekatan deteksi kecurangan pertama kita, penting untuk menentukan jumlah klaster dengan benar, terutama ketika Anda ingin menggunakan pencilan dari klaster tersebut sebagai prediksi kecurangan. Untuk memutuskan jumlah klaster yang akan digunakan, mari terapkan metode Elbow dan lihat berapa jumlah klaster optimal berdasarkan metode ini.
X_scaled kembali tersedia untuk Anda gunakan dan MiniBatchKMeans telah diimpor dari sklearn.
Latihan ini adalah bagian dari kursus
Deteksi Kecurangan di Python
Petunjuk latihan
- Tentukan rentang antara 1 hingga 5 klaster.
- Jalankan MiniBatch K-means pada semua klaster dalam rentang tersebut menggunakan list comprehension.
- Latih setiap model pada data yang telah diskalakan dan peroleh skornya dari data yang telah diskalakan.
- Plot nomor klaster dan skor masing-masing; proses ini akan memakan waktu beberapa detik.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define the range of clusters to try
clustno = range(____, ____)
# Run MiniBatch Kmeans over the number of clusters
kmeans = [____(n_clusters=i, random_state=0) for ____ in ____]
# Obtain the score for each model
score = [kmeans[i].fit(____).score(____) for i in range(len(kmeans))]
# Plot the models and their respective score
plt.plot(____, ____)
plt.xlabel('Number of Clusters')
plt.ylabel('Score')
plt.title('Elbow Curve')
plt.show()