Hierarchical clustering: metode ward
Saatnya Comic-Con! Comic-Con adalah konvensi tahunan bertema komik yang diadakan di berbagai kota besar di dunia. Anda memiliki data jumlah pengunjung tahun lalu, yaitu jumlah orang di area konvensi pada waktu tertentu. Anda ingin menentukan lokasi stan untuk memaksimalkan penjualan. Dengan menggunakan metode ward, terapkan hierarchical clustering untuk menemukan dua titik daya tarik di area tersebut.
Data disimpan dalam pandas DataFrame, comic_con. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari posisi orang pada waktu tertentu.
Latihan ini merupakan bagian dari kursus
Analisis Klaster di Python
Instruksi latihan
- Impor
fclusterdanlinkagedariscipy.cluster.hierarchy. - Gunakan metode
warddalam fungsilinkage(). - Tetapkan label klaster dengan membentuk 2 klaster datar dari
distance_matrix. - Jalankan kode plotting untuk melihat hasilnya.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()