Hiyerarşik kümeleme: single yöntemi
Aynı footfall veri kümesini kullanalım ve farklı bir kümeleme yöntemi kullanırsak herhangi bir değişiklik olup olmadığına bakalım.
Veri, comic_con adlı bir pandas DataFrame'inde saklanıyor. x_scaled ve y_scaled, belirli bir anda kişilerin standartlaştırılmış X ve Y koordinatlarının sütun adlarıdır.
Bu egzersiz
Python ile Kümeleme Analizi
kursunun bir parçasıdırEgzersiz talimatları
scipy.cluster.hierarchyiçindenfclustervelinkageöğelerini içe aktar.linkage()fonksiyonundasingleyöntemini kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the fcluster and linkage functions
from ____ import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[[____, ____]], ____ = ____, metric = ____)
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, ____)
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()