MulaiMulai sekarang secara gratis

Visualisasikan klaster dengan matplotlib

Kita telah membahas bahwa visualisasi diperlukan untuk menilai klaster yang terbentuk dan melihat tren dalam himpunan data Anda. Sekarang, mari fokus memvisualisasikan himpunan data jumlah pengunjung (footfall) dari Comic-Con menggunakan modul matplotlib.

Data disimpan dalam pandas DataFrame, comic_con. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari orang-orang pada suatu waktu tertentu. cluster_labels berisi label klaster. Objek linkage disimpan dalam variabel distance_matrix.

Latihan ini adalah bagian dari kursus

Analisis Klaster di Python

Lihat Kursus

Petunjuk latihan

  • Impor kelas pyplot dari modul matplotlib sebagai plt.
  • Definisikan dictionary colors untuk dua label klaster, 1 dan 2.
  • Buat plot sebar (scatter plot) dengan warna untuk setiap klaster sebagaimana didefinisikan oleh dictionary colors.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the pyplot class
____

# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}

# Plot a scatter plot
comic_con.plot.scatter(x=____, 
                	   y=____,
                	   c=comic_con['cluster_labels'].apply(____))
plt.show()
Edit dan Jalankan Kode