IniziaInizia gratis

Visualizzare i cluster con matplotlib

Abbiamo visto che le visualizzazioni sono fondamentali per valutare i cluster formati e individuare tendenze nei dati. Ora concentriamoci sulla visualizzazione dell'insieme di dati sul flusso di visitatori (footfall) del Comic-Con usando il modulo matplotlib.

I dati sono memorizzati in un DataFrame di pandas, comic_con. x_scaled e y_scaled sono i nomi delle colonne con le coordinate X e Y standardizzate delle persone in un dato momento. cluster_labels contiene le etichette di cluster. Un oggetto di linkage è salvato nella variabile distance_matrix.

Questo esercizio fa parte del corso

Analisi di cluster in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa la classe pyplot dal modulo matplotlib come plt.
  • Definisci un dizionario colors per due etichette di cluster, 1 e 2.
  • Traccia uno scatter plot colorando ciascun cluster come definito dal dizionario colors.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import the pyplot class
____

# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}

# Plot a scatter plot
comic_con.plot.scatter(x=____, 
                	   y=____,
                	   c=comic_con['cluster_labels'].apply(____))
plt.show()
Modifica ed esegui il codice