Aan de slagGa gratis aan de slag

Hoeveel dominante kleuren?

We hebben de volgende afbeelding geladen met de functie imread() van de image-klasse van matplotlib.

De RGB-waarden zijn opgeslagen in een DataFrame, batman_df. De RGB-waarden zijn gestandaardiseerd met de functie whiten() en opgeslagen in de kolommen scaled_red, scaled_blue en scaled_green.

Maak met het DataFrame een elbow-plot. Hoeveel dominante kleuren zijn er aanwezig?

Deze oefening maakt deel uit van de cursus

Clusteranalyse in Python

Cursus bekijken

Oefeninstructies

  • Maak een lijst met distortions op basis van elke waarde in num_clusters door de functie kmeans() uit te voeren.
  • Maak een DataFrame elbow_plot met de lijsten: num_clusters en distortions.
  • Plot de gegevens met de .lineplot()-methode van seaborn, met num_clusters op de x-as en distortions op de y-as.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

distortions = []
num_clusters = range(1, 7)

# Create a list of distortions from the kmeans function
for i in ____:
    cluster_centers, distortion = ____
    distortions.append(____)

# Create a DataFrame with two lists, num_clusters and distortions
elbow_plot = pd.DataFrame(____)

# Create a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = elbow_plot)
plt.xticks(num_clusters)
plt.show()
Code bewerken en uitvoeren