Aan de slagBegin gratis

Clusters visualiseren met matplotlib

We hebben besproken dat visualisaties nodig zijn om de gevormde clusters te beoordelen en trends in je data te zien. Laten we ons nu richten op het visualiseren van de footfall-gegevensset van Comic-Con met de module matplotlib.

De data staat in een pandas DataFrame, comic_con. x_scaled en y_scaled zijn de kolomnamen van de gestandaardiseerde X- en Y-coördinaten van personen op een bepaald moment. cluster_labels bevat de clusterlabels. Een linkage-object is opgeslagen in de variabele distance_matrix.

Deze oefening maakt deel uit van de cursus

Clusteranalyse in Python

Bekijk cursus

Oefeninstructies

  • Importeer de klasse pyplot uit de module matplotlib als plt.
  • Definieer een colors-dictionary voor twee clusterlabels, 1 en 2.
  • Maak een scatterplot met kleuren voor elk cluster zoals gedefinieerd door de colors-dictionary.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import the pyplot class
____

# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}

# Plot a scatter plot
comic_con.plot.scatter(x=____, 
                	   y=____,
                	   c=comic_con['cluster_labels'].apply(____))
plt.show()
Code bewerken en uitvoeren