Hierarchical clustering: metode ward
Saatnya Comic-Con! Comic-Con adalah konvensi tahunan bertema komik yang diadakan di berbagai kota besar di dunia. Anda memiliki data jumlah pengunjung tahun lalu, yaitu jumlah orang di area konvensi pada waktu tertentu. Anda ingin menentukan lokasi stan untuk memaksimalkan penjualan. Dengan menggunakan metode ward, terapkan hierarchical clustering untuk menemukan dua titik daya tarik di area tersebut.
Data disimpan dalam pandas DataFrame, comic_con. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari posisi orang pada waktu tertentu.
Latihan ini adalah bagian dari kursus
Analisis Klaster di Python
Petunjuk latihan
- Impor
fclusterdanlinkagedariscipy.cluster.hierarchy. - Gunakan metode
warddalam fungsilinkage(). - Tetapkan label klaster dengan membentuk 2 klaster datar dari
distance_matrix. - Jalankan kode plotting untuk melihat hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()