Quanti colori dominanti?
Abbiamo caricato la seguente immagine usando la funzione imread() della classe image di matplotlib.

I valori RGB sono memorizzati in un DataFrame, batman_df. I valori RGB sono stati standardizzati usando la funzione whiten(), e salvati nelle colonne scaled_red, scaled_blue e scaled_green.
Costruisci un elbow plot con il DataFrame. Quanti colori dominanti sono presenti?
Questo esercizio fa parte del corso
Analisi di cluster in Python
Istruzioni dell'esercizio
- Crea un elenco di distorsioni per ciascun valore in
num_clusterseseguendo la funzionekmeans(). - Crea un DataFrame
elbow_plotcon le liste:num_clustersedistortions. - Traccia i dati con il metodo
.lineplot()diseaborn, mettendonum_clusterssull'asse x edistortionssull'asse y.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
distortions = []
num_clusters = range(1, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
distortions.append(____)
# Create a DataFrame with two lists, num_clusters and distortions
elbow_plot = pd.DataFrame(____)
# Create a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = elbow_plot)
plt.xticks(num_clusters)
plt.show()