Visualizzare i cluster con matplotlib
Abbiamo visto che le visualizzazioni sono fondamentali per valutare i cluster formati e individuare tendenze nei dati. Ora concentriamoci sulla visualizzazione dell'insieme di dati sul flusso di visitatori (footfall) del Comic-Con usando il modulo matplotlib.
I dati sono memorizzati in un DataFrame di pandas, comic_con. x_scaled e y_scaled sono i nomi delle colonne con le coordinate X e Y standardizzate delle persone in un dato momento. cluster_labels contiene le etichette di cluster. Un oggetto di linkage è salvato nella variabile distance_matrix.
Questo esercizio fa parte del corso
Analisi di cluster in Python
Istruzioni dell'esercizio
- Importa la classe
pyplotdal modulomatplotlibcomeplt. - Definisci un dizionario
colorsper due etichette di cluster,1e2. - Traccia uno scatter plot colorando ciascun cluster come definito dal dizionario
colors.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the pyplot class
____
# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}
# Plot a scatter plot
comic_con.plot.scatter(x=____,
y=____,
c=comic_con['cluster_labels'].apply(____))
plt.show()