Hiyerarşik kümeleme: ward yöntemi
Comic-Con zamanı! Comic-Con, dünyanın büyük şehirlerinde düzenlenen yıllık bir çizgi roman temelli etkinlik. Elinde geçen yılın yaya trafiği verisi var; yani belli bir anda etkinlik alanındaki kişi sayısı. Satışları en üst düzeye çıkarmak için standının yerini belirlemek istiyorsun. Ward yöntemini kullanarak, alandaki iki çekim noktasını bulmak için hiyerarşik kümeleme uygula.
Veriler bir pandas DataFrame'i olan comic_con içinde. x_scaled ve y_scaled, belirli bir andaki kişilerin standartlaştırılmış X ve Y koordinatlarının sütun adlarıdır.
Bu egzersiz
Python ile Kümeleme Analizi
kursunun bir parçasıdırEgzersiz talimatları
scipy.cluster.hierarchyiçindenfclustervelinkageöğelerini içe aktar.linkage()fonksiyonundawardyöntemini kullan.distance_matrixüzerinden 2 düz küme oluşturarak küme etiketlerini ata.- Sonuçları görmek için çizim kodunu çalıştır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()