Visualisasikan klaster dengan matplotlib
Kita telah membahas bahwa visualisasi diperlukan untuk menilai klaster yang terbentuk dan melihat tren dalam himpunan data Anda. Sekarang, mari fokus memvisualisasikan himpunan data jumlah pengunjung (footfall) dari Comic-Con menggunakan modul matplotlib.
Data disimpan dalam pandas DataFrame, comic_con. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari orang-orang pada suatu waktu tertentu. cluster_labels berisi label klaster. Objek linkage disimpan dalam variabel distance_matrix.
Latihan ini adalah bagian dari kursus
Analisis Klaster di Python
Petunjuk latihan
- Impor kelas
pyplotdari modulmatplotlibsebagaiplt. - Definisikan dictionary
colorsuntuk dua label klaster,1dan2. - Buat plot sebar (scatter plot) dengan warna untuk setiap klaster sebagaimana didefinisikan oleh dictionary
colors.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the pyplot class
____
# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}
# Plot a scatter plot
comic_con.plot.scatter(x=____,
y=____,
c=comic_con['cluster_labels'].apply(____))
plt.show()