Elbow-methode
De silhouette-score en de elbow-methode helpen je de resultaten die je ziet te valideren. In een Machine Learning-sollicitatie kun je naar één van beide worden gevraagd, maar als je de details van de ene in de context van de andere kunt plaatsen, versterkt dat je antwoord enorm.
In deze oefening initialiseer je voor elke waarde van k een K-means-model en gebruik je het attribuut inertia_ om de som van de gekwadrateerde afstanden van samples tot het dichtstbijzijnde clustercentrum te bepalen. Wanneer je deze waarden uitzet, zou er een ‘knik’ (elbow) in de grafiek zichtbaar moeten zijn.
Onthoud uit de vorige les dat naarmate de waarde van k toenam, de waarde van inertia_ afnam.
matplotlib.pyplot is al geïmporteerd als plt en KMeans komt uit sklearn.cluster. De featurematrix X is ook al voor je aangemaakt.
Deze oefening maakt deel uit van de cursus
Machine Learning-sollicitatievragen oefenen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create empty list
sum_of_squared_distances = ____