LoslegenKostenlos loslegen

Cluster mit matplotlib visualisieren

Wir haben besprochen, dass Visualisierungen nötig sind, um die gebildeten Cluster zu beurteilen und Trends in deinen Daten zu erkennen. Jetzt konzentrieren wir uns darauf, den Footfall-Datensatz von der Comic-Con mit dem Modul matplotlib zu visualisieren.

Die Daten liegen in einem pandas DataFrame comic_con. x_scaled und y_scaled sind die Spaltennamen der standardisierten X- und Y-Koordinaten der Personen zu einem bestimmten Zeitpunkt. cluster_labels enthält die Cluster-Labels. Ein Linkage-Objekt ist in der Variablen distance_matrix gespeichert.

Diese Übung ist Teil des Kurses

Cluster Analysis in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere die Klasse pyplot aus dem Modul matplotlib als plt.
  • Definiere ein Dictionary colors für zwei Cluster-Labels, 1 und 2.
  • Erstelle ein Streudiagramm und färbe die Punkte pro Cluster gemäß dem Dictionary colors.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the pyplot class
____

# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}

# Plot a scatter plot
comic_con.plot.scatter(x=____, 
                	   y=____,
                	   c=comic_con['cluster_labels'].apply(____))
plt.show()
Code bearbeiten und ausführen