Clusters visualiseren met matplotlib
We hebben besproken dat visualisaties nodig zijn om de gevormde clusters te beoordelen en trends in je data te zien. Laten we ons nu richten op het visualiseren van de footfall-gegevensset van Comic-Con met de module matplotlib.
De data staat in een pandas DataFrame, comic_con. x_scaled en y_scaled zijn de kolomnamen van de gestandaardiseerde X- en Y-coördinaten van personen op een bepaald moment. cluster_labels bevat de clusterlabels. Een linkage-object is opgeslagen in de variabele distance_matrix.
Deze oefening maakt deel uit van de cursus
Clusteranalyse in Python
Oefeninstructies
- Importeer de klasse
pyplotuit de modulematplotlibalsplt. - Definieer een
colors-dictionary voor twee clusterlabels,1en2. - Maak een scatterplot met kleuren voor elk cluster zoals gedefinieerd door de
colors-dictionary.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the pyplot class
____
# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}
# Plot a scatter plot
comic_con.plot.scatter(x=____,
y=____,
c=comic_con['cluster_labels'].apply(____))
plt.show()