LoslegenKostenlos loslegen

Pokémon-Sichtungen: k-means-Clustering

Wir führen die Untersuchung der Sichtungen legendärer Pokémon aus der vorherigen Übung fort. Genau wie zuvor nutzen wir das gleiche Beispiel mit Pokémon-Sichtungen. In dieser Übung bildest du Cluster der Sichtungen mithilfe von k-means-Clustering.

x und y sind Spalten mit den X- und Y-Koordinaten der Sichtungsorte, gespeichert in einem pandas DataFrame df. Folgendes steht dir zur Verfügung: matplotlib.pyplot als plt, seaborn als sns und pandas als pd.

Diese Übung ist Teil des Kurses

Cluster Analysis in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere die Funktionen kmeans und vq.
  • Verwende die Funktion kmeans(), um durch Festlegen von zwei Clustern die Cluster-Zentren zu berechnen.
  • Weise jedem Datenpunkt mithilfe von vq() Cluster-Labels zu.
  • Plotte die Punkte mit seaborn und weise jedem Cluster eine andere Farbe zu.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import kmeans and vq functions
from scipy.cluster.vq import ____, ____

# Compute cluster centers
centroids,_ = ____(____, ____)

# Assign cluster labels
df['cluster_labels'], _ = ____(____, ____)

# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()
Code bearbeiten und ausführen