Aan de slagGa gratis aan de slag

Clusters visualiseren met matplotlib

We hebben besproken dat visualisaties nodig zijn om de gevormde clusters te beoordelen en trends in je data te zien. Laten we ons nu richten op het visualiseren van de footfall-gegevensset van Comic-Con met de module matplotlib.

De data staat in een pandas DataFrame, comic_con. x_scaled en y_scaled zijn de kolomnamen van de gestandaardiseerde X- en Y-coördinaten van personen op een bepaald moment. cluster_labels bevat de clusterlabels. Een linkage-object is opgeslagen in de variabele distance_matrix.

Deze oefening maakt deel uit van de cursus

Clusteranalyse in Python

Cursus bekijken

Oefeninstructies

  • Importeer de klasse pyplot uit de module matplotlib als plt.
  • Definieer een colors-dictionary voor twee clusterlabels, 1 en 2.
  • Maak een scatterplot met kleuren voor elk cluster zoals gedefinieerd door de colors-dictionary.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the pyplot class
____

# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}

# Plot a scatter plot
comic_con.plot.scatter(x=____, 
                	   y=____,
                	   c=comic_con['cluster_labels'].apply(____))
plt.show()
Code bewerken en uitvoeren