Observations de Pokémon : clustering k-means
Nous allons poursuivre l’enquête sur les observations de Pokémon légendaires commencée à l’exercice précédent. Comme précédemment, nous utiliserons le même exemple d’observations de Pokémon. Dans cet exercice, vous allez regrouper les observations en clusters à l’aide du clustering k-means.
x et y sont les colonnes des coordonnées X et Y des lieux d’observation, stockées dans un DataFrame pandas, df. Vous avez à disposition : matplotlib.pyplot sous plt, seaborn sous sns, et pandas sous pd.
Cet exercice fait partie du cours
Analyse de clusters en Python
Instructions
- Importez les fonctions
kmeansetvq. - Utilisez la fonction
kmeans()pour calculer les centres des clusters en définissant deux clusters. - Attribuez une étiquette de cluster à chaque point de données avec la fonction
vq(). - Représentez les points avec seaborn et affectez une couleur différente à chaque cluster.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import kmeans and vq functions
from scipy.cluster.vq import ____, ____
# Compute cluster centers
centroids,_ = ____(____, ____)
# Assign cluster labels
df['cluster_labels'], _ = ____(____, ____)
# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()