Berapa banyak klaster untuk biji-bijian?
Dalam video, Anda mempelajari cara memilih jumlah klaster yang baik untuk suatu himpunan data menggunakan grafik inersia k-means. Anda diberikan sebuah array samples yang berisi pengukuran (seperti luas, keliling, panjang, dan beberapa lainnya) dari sampel biji-bijian. Berapa jumlah klaster yang baik dalam kasus ini?
KMeans dan PyPlot (plt) telah diimpor untuk Anda.
Himpunan data ini berasal dari UCI Machine Learning Repository.
Latihan ini adalah bagian dari kursus
Unsupervised Learning in Python
Petunjuk latihan
- Untuk setiap nilai
kyang diberikan, lakukan langkah-langkah berikut: - Buat instance
KMeansbernamamodeldengankklaster. - Fit model ke data biji-bijian
samples. - Tambahkan nilai atribut
inertia_darimodelke daftarinertias. - Kode untuk memplot
ksvsinertiastelah dituliskan untuk Anda, jadi tekan kirim untuk melihat plotnya!
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()