Combien de couleurs dominantes ?
Nous avons chargé l’image suivante à l’aide de la fonction imread() de la classe image de matplotlib.

Les valeurs RVB sont stockées dans un DataFrame, batman_df. Elles ont été standardisées à l’aide de la fonction whiten() et enregistrées dans les colonnes scaled_red, scaled_blue et scaled_green.
Construisez un graphique du coude (elbow plot) avec ce DataFrame. Combien de couleurs dominantes sont présentes ?
Cet exercice fait partie du cours
Analyse de clusters en Python
Instructions
- Créez une liste de distorsions pour chaque valeur de
num_clustersen exécutant la fonctionkmeans(). - Créez un DataFrame
elbow_plotavec les listes :num_clustersetdistortions. - Tracez les données avec la méthode
.lineplot()deseaborn, avecnum_clusterssur l’axe des x etdistortionssur l’axe des y.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
distortions = []
num_clusters = range(1, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
distortions.append(____)
# Create a DataFrame with two lists, num_clusters and distortions
elbow_plot = pd.DataFrame(____)
# Create a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = elbow_plot)
plt.xticks(num_clusters)
plt.show()