Pokémon-Sichtungen: k-means-Clustering
Wir führen die Untersuchung der Sichtungen legendärer Pokémon aus der vorherigen Übung fort. Genau wie zuvor nutzen wir das gleiche Beispiel mit Pokémon-Sichtungen. In dieser Übung bildest du Cluster der Sichtungen mithilfe von k-means-Clustering.
x und y sind Spalten mit den X- und Y-Koordinaten der Sichtungsorte, gespeichert in einem pandas DataFrame df. Folgendes steht dir zur Verfügung: matplotlib.pyplot als plt, seaborn als sns und pandas als pd.
Diese Übung ist Teil des Kurses
Cluster Analysis in Python
Anleitung zur Übung
- Importiere die Funktionen
kmeansundvq. - Verwende die Funktion
kmeans(), um durch Festlegen von zwei Clustern die Cluster-Zentren zu berechnen. - Weise jedem Datenpunkt mithilfe von
vq()Cluster-Labels zu. - Plotte die Punkte mit seaborn und weise jedem Cluster eine andere Farbe zu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import kmeans and vq functions
from scipy.cluster.vq import ____, ____
# Compute cluster centers
centroids,_ = ____(____, ____)
# Assign cluster labels
df['cluster_labels'], _ = ____(____, ____)
# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()