LoslegenKostenlos loslegen

Pokémon-Sichtungen: hierarchisches Clustering

Wir führen die Untersuchung der Sichtungen legendärer Pokémon aus der vorherigen Übung fort. Erinnerst du dich? Im Streudiagramm der letzten Aufgabe hast du zwei Bereiche erkannt, in denen Pokémon-Sichtungen gehäuft auftraten. Das deutet darauf hin, dass sich die Punkte in zwei Cluster aufteilen. In dieser Übung bildest du mithilfe von hierarchischem Clustering zwei Cluster aus den Sichtungen.

'x' und 'y' sind Spalten mit den X- und Y-Koordinaten der Sichtungsorte und liegen in einem pandas-DataFrame df. Folgendes steht dir zur Verfügung: matplotlib.pyplot als plt, seaborn als sns und pandas als pd.

Diese Übung ist Teil des Kurses

Cluster Analysis in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere die Bibliotheken linkage und fcluster.
  • Verwende die Funktion linkage(), um Distanzen mit der Ward-Methode zu berechnen.
  • Erzeuge mit fcluster() Clusterlabels für jeden Datenpunkt mit zwei Clustern.
  • Plotte die Punkte mit seaborn und weise jedem Cluster eine andere Farbe zu.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import linkage and fcluster functions
from scipy.cluster.hierarchy import ____, ____

# Use the linkage() function to compute distance
Z = ____(____, 'ward')

# Generate cluster labels
df['cluster_labels'] = ____(____, ____, criterion='maxclust')

# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()
Code bearbeiten und ausführen