CommencerCommencer gratuitement

Visualiser des clusters avec matplotlib

Nous avons vu que les visualisations sont essentielles pour évaluer les clusters formés et repérer des tendances dans vos données. Concentrons-nous maintenant sur la visualisation du jeu de données de fréquentation (footfall) de Comic-Con avec le module matplotlib.

Les données sont stockées dans un DataFrame pandas, comic_con. x_scaled et y_scaled sont les noms des colonnes contenant les coordonnées X et Y standardisées des personnes à un instant donné. cluster_labels contient les étiquettes de cluster. Un objet de chaînage (linkage) est stocké dans la variable distance_matrix.

Cet exercice fait partie du cours

Analyse de clusters en Python

Afficher le cours

Instructions

  • Importez la classe pyplot du module matplotlib sous le nom plt.
  • Définissez un dictionnaire colors pour deux étiquettes de cluster, 1 et 2.
  • Tracez un nuage de points en colorant chaque cluster selon le dictionnaire colors.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the pyplot class
____

# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}

# Plot a scatter plot
comic_con.plot.scatter(x=____, 
                	   y=____,
                	   c=comic_con['cluster_labels'].apply(____))
plt.show()
Modifier et exécuter le code