BaşlayınÜcretsiz Başlayın

K-means kümeleme: ilk egzersiz

Bu egzersiz, bir veri kümesi üzerinde k-means kümelemenin kullanımına alışmanı sağlayacak. Comic Con veri kümesini kullanalım ve k-means kümelemenin onda nasıl çalıştığını görelim.

K-means kümelemenin iki adımını hatırla:

  • kmeans() fonksiyonu ile küme merkezlerini tanımla. İki zorunlu argümanı vardır: gözlemler ve küme sayısı.
  • vq() fonksiyonu ile küme etiketlerini ata. İki zorunlu argümanı vardır: gözlemler ve küme merkezleri.

Veriler bir pandas DataFrame’i olan comic_con içinde saklanıyor. x_scaled ve y_scaled, belirli bir anda insanların standartlaştırılmış X ve Y koordinatlarının sütun adlarıdır.

Bu egzersiz

Python ile Kümeleme Analizi

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • SciPy içinde kmeans ve vq fonksiyonlarını içe aktar.
  • kmeans() fonksiyonunu iki küme ile kullanarak küme merkezlerini üret.
  • Bu küme merkezlerini kullanarak küme etiketleri oluştur.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import the kmeans and vq functions
from ____.cluster.vq import ____, ____

# Generate cluster centers
cluster_centers, distortion = ____

# Assign cluster labels
comic_con['cluster_labels'], distortion_list = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Kodu Düzenle ve Çalıştır