CommencerCommencez gratuitement

Observations de Pokémon : clustering k-means

Nous allons poursuivre l’enquête sur les observations de Pokémon légendaires commencée à l’exercice précédent. Comme précédemment, nous utiliserons le même exemple d’observations de Pokémon. Dans cet exercice, vous allez regrouper les observations en clusters à l’aide du clustering k-means.

x et y sont les colonnes des coordonnées X et Y des lieux d’observation, stockées dans un DataFrame pandas, df. Vous avez à disposition : matplotlib.pyplot sous plt, seaborn sous sns, et pandas sous pd.

Cet exercice fait partie du cours

<cours>Analyse de clusters en Python</cours>
Voir le cours

Instructions de l’exercice

  • Importez les fonctions kmeans et vq.
  • Utilisez la fonction kmeans() pour calculer les centres des clusters en définissant deux clusters.
  • Attribuez une étiquette de cluster à chaque point de données avec la fonction vq().
  • Représentez les points avec seaborn et affectez une couleur différente à chaque cluster.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import kmeans and vq functions
from scipy.cluster.vq import ____, ____

# Compute cluster centers
centroids,_ = ____(____, ____)

# Assign cluster labels
df['cluster_labels'], _ = ____(____, ____)

# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()
Modifier et exécuter le code