Mulai sekarangMulai gratis

Hierarchical clustering: metode ward

Saatnya Comic-Con! Comic-Con adalah konvensi tahunan bertema komik yang diadakan di berbagai kota besar di dunia. Anda memiliki data jumlah pengunjung tahun lalu, yaitu jumlah orang di area konvensi pada waktu tertentu. Anda ingin menentukan lokasi stan untuk memaksimalkan penjualan. Dengan menggunakan metode ward, terapkan hierarchical clustering untuk menemukan dua titik daya tarik di area tersebut.

Data disimpan dalam pandas DataFrame, comic_con. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari posisi orang pada waktu tertentu.

Latihan ini merupakan bagian dari kursus

Analisis Klaster di Python

Lihat Kursus

Instruksi latihan

  • Impor fcluster dan linkage dari scipy.cluster.hierarchy.
  • Gunakan metode ward dalam fungsi linkage().
  • Tetapkan label klaster dengan membentuk 2 klaster datar dari distance_matrix.
  • Jalankan kode plotting untuk melihat hasilnya.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____

# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')

# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Edit dan Jalankan Kode