Visualiser des clusters avec matplotlib
Nous avons vu que les visualisations sont essentielles pour évaluer les clusters formés et repérer des tendances dans vos données. Concentrons-nous maintenant sur la visualisation du jeu de données de fréquentation (footfall) de Comic-Con avec le module matplotlib.
Les données sont stockées dans un DataFrame pandas, comic_con. x_scaled et y_scaled sont les noms des colonnes contenant les coordonnées X et Y standardisées des personnes à un instant donné. cluster_labels contient les étiquettes de cluster. Un objet de chaînage (linkage) est stocké dans la variable distance_matrix.
Cet exercice fait partie du cours
Analyse de clusters en Python
Instructions
- Importez la classe
pyplotdu modulematplotlibsous le nomplt. - Définissez un dictionnaire
colorspour deux étiquettes de cluster,1et2. - Tracez un nuage de points en colorant chaque cluster selon le dictionnaire
colors.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the pyplot class
____
# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}
# Plot a scatter plot
comic_con.plot.scatter(x=____,
y=____,
c=comic_con['cluster_labels'].apply(____))
plt.show()