Pokémon-Sichtungen: hierarchisches Clustering
Wir führen die Untersuchung der Sichtungen legendärer Pokémon aus der vorherigen Übung fort. Erinnerst du dich? Im Streudiagramm der letzten Aufgabe hast du zwei Bereiche erkannt, in denen Pokémon-Sichtungen gehäuft auftraten. Das deutet darauf hin, dass sich die Punkte in zwei Cluster aufteilen. In dieser Übung bildest du mithilfe von hierarchischem Clustering zwei Cluster aus den Sichtungen.
'x' und 'y' sind Spalten mit den X- und Y-Koordinaten der Sichtungsorte und liegen in einem pandas-DataFrame df. Folgendes steht dir zur Verfügung: matplotlib.pyplot als plt, seaborn als sns und pandas als pd.
Diese Übung ist Teil des Kurses
Cluster Analysis in Python
Anleitung zur Übung
- Importiere die Bibliotheken
linkageundfcluster. - Verwende die Funktion
linkage(), um Distanzen mit der Ward-Methode zu berechnen. - Erzeuge mit
fcluster()Clusterlabels für jeden Datenpunkt mit zwei Clustern. - Plotte die Punkte mit seaborn und weise jedem Cluster eine andere Farbe zu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import linkage and fcluster functions
from scipy.cluster.hierarchy import ____, ____
# Use the linkage() function to compute distance
Z = ____(____, 'ward')
# Generate cluster labels
df['cluster_labels'] = ____(____, ____, criterion='maxclust')
# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()