Kaç tahıl kümesi var?
Videoda, bir veri kümesi için iyi bir küme sayısını k-means atalet grafiğini kullanarak nasıl seçeceğini öğrendin. Sana, tahıl örneklerinin ölçümlerini (örneğin alan, çevre, uzunluk ve diğer bazıları) içeren samples dizisi verildi. Bu durumda iyi bir küme sayısı nedir?
KMeans ve PyPlot (plt) senin için zaten içe aktarıldı.
Bu veri kümesi UCI Machine Learning Repository kaynağından alınmıştır.
Bu egzersiz
Python'da Unsupervised Learning
kursunun bir parçasıdırEgzersiz talimatları
- Verilen her
kdeğeri için şu adımları uygula: kküme ilemodeladlı birKMeansörneği oluştur.- Modeli tahıl verisi
samplesüzerine uydur. modelnesnesinininertia_özniteliğinin değeriniinertiaslistesine ekle.ksileinertiasdeğerlerini çizen kod senin için yazıldı, grafiği görmek için Gönder’e bas!
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()