BaşlayınÜcretsiz başlayın

Hiyerarşik kümeleme: ward yöntemi

Comic-Con zamanı! Comic-Con, dünyanın büyük şehirlerinde düzenlenen yıllık bir çizgi roman temelli etkinlik. Elinde geçen yılın yaya trafiği verisi var; yani belli bir anda etkinlik alanındaki kişi sayısı. Satışları en üst düzeye çıkarmak için standının yerini belirlemek istiyorsun. Ward yöntemini kullanarak, alandaki iki çekim noktasını bulmak için hiyerarşik kümeleme uygula.

Veriler bir pandas DataFrame'i olan comic_con içinde. x_scaled ve y_scaled, belirli bir andaki kişilerin standartlaştırılmış X ve Y koordinatlarının sütun adlarıdır.

Bu egzersiz, kursun bir parçasıdır

Python ile Kümeleme Analizi

Kursa Göz Atın

Egzersiz talimatları

  • scipy.cluster.hierarchy içinden fcluster ve linkage öğelerini içe aktar.
  • linkage() fonksiyonunda ward yöntemini kullan.
  • distance_matrix üzerinden 2 düz küme oluşturarak küme etiketlerini ata.
  • Sonuçları görmek için çizim kodunu çalıştır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____

# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')

# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Kodu Düzenle ve Çalıştır