Cluster mit matplotlib visualisieren
Wir haben besprochen, dass Visualisierungen nötig sind, um die gebildeten Cluster zu beurteilen und Trends in deinen Daten zu erkennen. Jetzt konzentrieren wir uns darauf, den Footfall-Datensatz von der Comic-Con mit dem Modul matplotlib zu visualisieren.
Die Daten liegen in einem pandas DataFrame comic_con. x_scaled und y_scaled sind die Spaltennamen der standardisierten X- und Y-Koordinaten der Personen zu einem bestimmten Zeitpunkt. cluster_labels enthält die Cluster-Labels. Ein Linkage-Objekt ist in der Variablen distance_matrix gespeichert.
Diese Übung ist Teil des Kurses
Cluster Analysis in Python
Anleitung zur Übung
- Importiere die Klasse
pyplotaus dem Modulmatplotlibalsplt. - Definiere ein Dictionary
colorsfür zwei Cluster-Labels,1und2. - Erstelle ein Streudiagramm und färbe die Punkte pro Cluster gemäß dem Dictionary
colors.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the pyplot class
____
# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}
# Plot a scatter plot
comic_con.plot.scatter(x=____,
y=____,
c=comic_con['cluster_labels'].apply(____))
plt.show()