Aan de slagGa gratis aan de slag

Pokémon-waarnemingen: k-means clustering

We gaan verder met het onderzoek naar waarnemingen van legendarische Pokémon uit de vorige oefening. Net als in de vorige oefening gebruiken we hetzelfde voorbeeld van Pokémon-waarnemingen. In deze oefening vorm je clusters van de waarnemingen met k-means clustering.

x en y zijn kolommen met X- en Y-coördinaten van de locaties van waarnemingen, opgeslagen in een pandas DataFrame, df. De volgende modules zijn beschikbaar: matplotlib.pyplot als plt, seaborn als sns en pandas als pd.

Deze oefening maakt deel uit van de cursus

Clusteranalyse in Python

Cursus bekijken

Oefeninstructies

  • Importeer de functies kmeans en vq.
  • Gebruik de functie kmeans() om de clustercentra te berekenen door twee clusters te definiëren.
  • Ken met de functie vq() clusterlabels toe aan elk datapunt.
  • Plot de punten met seaborn en geef elk cluster een andere kleur

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import kmeans and vq functions
from scipy.cluster.vq import ____, ____

# Compute cluster centers
centroids,_ = ____(____, ____)

# Assign cluster labels
df['cluster_labels'], _ = ____(____, ____)

# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()
Code bewerken en uitvoeren