MulaiMulai sekarang secara gratis

Hierarchical clustering: metode ward

Saatnya Comic-Con! Comic-Con adalah konvensi tahunan bertema komik yang diadakan di berbagai kota besar di dunia. Anda memiliki data jumlah pengunjung tahun lalu, yaitu jumlah orang di area konvensi pada waktu tertentu. Anda ingin menentukan lokasi stan untuk memaksimalkan penjualan. Dengan menggunakan metode ward, terapkan hierarchical clustering untuk menemukan dua titik daya tarik di area tersebut.

Data disimpan dalam pandas DataFrame, comic_con. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari posisi orang pada waktu tertentu.

Latihan ini adalah bagian dari kursus

Analisis Klaster di Python

Lihat Kursus

Petunjuk latihan

  • Impor fcluster dan linkage dari scipy.cluster.hierarchy.
  • Gunakan metode ward dalam fungsi linkage().
  • Tetapkan label klaster dengan membentuk 2 klaster datar dari distance_matrix.
  • Jalankan kode plotting untuk melihat hasilnya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____

# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')

# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Edit dan Jalankan Kode