CommencerCommencez gratuitement

Combien de couleurs dominantes ?

Nous avons chargé l’image suivante à l’aide de la fonction imread() de la classe image de matplotlib.

Les valeurs RVB sont stockées dans un DataFrame, batman_df. Elles ont été standardisées à l’aide de la fonction whiten() et enregistrées dans les colonnes scaled_red, scaled_blue et scaled_green.

Construisez un graphique du coude (elbow plot) avec ce DataFrame. Combien de couleurs dominantes sont présentes ?

Cet exercice fait partie du cours

<cours>Analyse de clusters en Python</cours>
Voir le cours

Instructions de l’exercice

  • Créez une liste de distorsions pour chaque valeur de num_clusters en exécutant la fonction kmeans().
  • Créez un DataFrame elbow_plot avec les listes : num_clusters et distortions.
  • Tracez les données avec la méthode .lineplot() de seaborn, avec num_clusters sur l’axe des x et distortions sur l’axe des y.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

distortions = []
num_clusters = range(1, 7)

# Create a list of distortions from the kmeans function
for i in ____:
    cluster_centers, distortion = ____
    distortions.append(____)

# Create a DataFrame with two lists, num_clusters and distortions
elbow_plot = pd.DataFrame(____)

# Create a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = elbow_plot)
plt.xticks(num_clusters)
plt.show()
Modifier et exécuter le code