Mulai sekarangMulai gratis

Visualisasikan klaster dengan matplotlib

Kita telah membahas bahwa visualisasi diperlukan untuk menilai klaster yang terbentuk dan melihat tren dalam himpunan data Anda. Sekarang, mari fokus memvisualisasikan himpunan data jumlah pengunjung (footfall) dari Comic-Con menggunakan modul matplotlib.

Data disimpan dalam pandas DataFrame, comic_con. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari orang-orang pada suatu waktu tertentu. cluster_labels berisi label klaster. Objek linkage disimpan dalam variabel distance_matrix.

Latihan ini merupakan bagian dari kursus

Analisis Klaster di Python

Lihat Kursus

Instruksi latihan

  • Impor kelas pyplot dari modul matplotlib sebagai plt.
  • Definisikan dictionary colors untuk dua label klaster, 1 dan 2.
  • Buat plot sebar (scatter plot) dengan warna untuk setiap klaster sebagaimana didefinisikan oleh dictionary colors.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import the pyplot class
____

# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}

# Plot a scatter plot
comic_con.plot.scatter(x=____, 
                	   y=____,
                	   c=comic_con['cluster_labels'].apply(____))
plt.show()
Edit dan Jalankan Kode