K-means kümeleme: ilk egzersiz
Bu egzersiz, bir veri kümesi üzerinde k-means kümelemenin kullanımına alışmanı sağlayacak. Comic Con veri kümesini kullanalım ve k-means kümelemenin onda nasıl çalıştığını görelim.
K-means kümelemenin iki adımını hatırla:
kmeans()fonksiyonu ile küme merkezlerini tanımla. İki zorunlu argümanı vardır: gözlemler ve küme sayısı.vq()fonksiyonu ile küme etiketlerini ata. İki zorunlu argümanı vardır: gözlemler ve küme merkezleri.
Veriler bir pandas DataFrame’i olan comic_con içinde saklanıyor. x_scaled ve y_scaled, belirli bir anda insanların standartlaştırılmış X ve Y koordinatlarının sütun adlarıdır.
Bu egzersiz
Python ile Kümeleme Analizi
kursunun bir parçasıdırEgzersiz talimatları
- SciPy içinde
kmeansvevqfonksiyonlarını içe aktar. kmeans()fonksiyonunu iki küme ile kullanarak küme merkezlerini üret.- Bu küme merkezlerini kullanarak küme etiketleri oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the kmeans and vq functions
from ____.cluster.vq import ____, ____
# Generate cluster centers
cluster_centers, distortion = ____
# Assign cluster labels
comic_con['cluster_labels'], distortion_list = ____
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()