Hoeveel dominante kleuren?
We hebben de volgende afbeelding geladen met de functie imread() van de image-klasse van matplotlib.

De RGB-waarden zijn opgeslagen in een DataFrame, batman_df. De RGB-waarden zijn gestandaardiseerd met de functie whiten() en opgeslagen in de kolommen scaled_red, scaled_blue en scaled_green.
Maak met het DataFrame een elbow-plot. Hoeveel dominante kleuren zijn er aanwezig?
Deze oefening maakt deel uit van de cursus
Clusteranalyse in Python
Oefeninstructies
- Maak een lijst met distortions op basis van elke waarde in
num_clustersdoor de functiekmeans()uit te voeren. - Maak een DataFrame
elbow_plotmet de lijsten:num_clustersendistortions. - Plot de gegevens met de
.lineplot()-methode vanseaborn, metnum_clustersop de x-as endistortionsop de y-as.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
distortions = []
num_clusters = range(1, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
distortions.append(____)
# Create a DataFrame with two lists, num_clusters and distortions
elbow_plot = pd.DataFrame(____)
# Create a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = elbow_plot)
plt.xticks(num_clusters)
plt.show()