BaşlayınÜcretsiz Başlayın

Hiyerarşik kümeleme: ward yöntemi

Comic-Con zamanı! Comic-Con, dünyanın büyük şehirlerinde düzenlenen yıllık bir çizgi roman temelli etkinlik. Elinde geçen yılın yaya trafiği verisi var; yani belli bir anda etkinlik alanındaki kişi sayısı. Satışları en üst düzeye çıkarmak için standının yerini belirlemek istiyorsun. Ward yöntemini kullanarak, alandaki iki çekim noktasını bulmak için hiyerarşik kümeleme uygula.

Veriler bir pandas DataFrame'i olan comic_con içinde. x_scaled ve y_scaled, belirli bir andaki kişilerin standartlaştırılmış X ve Y koordinatlarının sütun adlarıdır.

Bu egzersiz

Python ile Kümeleme Analizi

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • scipy.cluster.hierarchy içinden fcluster ve linkage öğelerini içe aktar.
  • linkage() fonksiyonunda ward yöntemini kullan.
  • distance_matrix üzerinden 2 düz küme oluşturarak küme etiketlerini ata.
  • Sonuçları görmek için çizim kodunu çalıştır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____

# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')

# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Kodu Düzenle ve Çalıştır