CommencerCommencer gratuitement

Observations de Pokémon : clustering k-means

Nous allons poursuivre l’enquête sur les observations de Pokémon légendaires commencée à l’exercice précédent. Comme précédemment, nous utiliserons le même exemple d’observations de Pokémon. Dans cet exercice, vous allez regrouper les observations en clusters à l’aide du clustering k-means.

x et y sont les colonnes des coordonnées X et Y des lieux d’observation, stockées dans un DataFrame pandas, df. Vous avez à disposition : matplotlib.pyplot sous plt, seaborn sous sns, et pandas sous pd.

Cet exercice fait partie du cours

Analyse de clusters en Python

Afficher le cours

Instructions

  • Importez les fonctions kmeans et vq.
  • Utilisez la fonction kmeans() pour calculer les centres des clusters en définissant deux clusters.
  • Attribuez une étiquette de cluster à chaque point de données avec la fonction vq().
  • Représentez les points avec seaborn et affectez une couleur différente à chaque cluster.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import kmeans and vq functions
from scipy.cluster.vq import ____, ____

# Compute cluster centers
centroids,_ = ____(____, ____)

# Assign cluster labels
df['cluster_labels'], _ = ____(____, ____)

# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()
Modifier et exécuter le code