Pokémon-waarnemingen: k-means clustering
We gaan verder met het onderzoek naar waarnemingen van legendarische Pokémon uit de vorige oefening. Net als in de vorige oefening gebruiken we hetzelfde voorbeeld van Pokémon-waarnemingen. In deze oefening vorm je clusters van de waarnemingen met k-means clustering.
x en y zijn kolommen met X- en Y-coördinaten van de locaties van waarnemingen, opgeslagen in een pandas DataFrame, df. De volgende modules zijn beschikbaar: matplotlib.pyplot als plt, seaborn als sns en pandas als pd.
Deze oefening maakt deel uit van de cursus
Clusteranalyse in Python
Oefeninstructies
- Importeer de functies
kmeansenvq. - Gebruik de functie
kmeans()om de clustercentra te berekenen door twee clusters te definiëren. - Ken met de functie
vq()clusterlabels toe aan elk datapunt. - Plot de punten met seaborn en geef elk cluster een andere kleur
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import kmeans and vq functions
from scipy.cluster.vq import ____, ____
# Compute cluster centers
centroids,_ = ____(____, ____)
# Assign cluster labels
df['cluster_labels'], _ = ____(____, ____)
# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()