Elbow-Methode
Der Silhouetten-Score und die Elbow-Methode helfen dir dabei, die Ergebnisse jeweils zu validieren. In einem Machine-Learning-Interview wirst du vielleicht nach der einen oder der anderen gefragt, aber wenn du die Besonderheiten der einen im Kontext der anderen erklärst, stärkt das deine Antwort deutlich.
In dieser Übung initialisierst du für jeden k-Wert ein K-Means-Modell und verwendest das Attribut inertia_, um die Summe der quadrierten Abstände der Stichproben zum nächstgelegenen Clusterzentrum zu bestimmen. Dargestellt in einem Plot zeigt sich dabei oft ein „Ellbogen“.
Erinnere dich an die letzte Lektion: Wenn der Wert von k steigt, sinkt der Wert von inertia_.
Bereits für dich importiert sind matplotlib.pyplot als plt und KMeans aus sklearn.cluster. Die Merkmalsmatrix X wurde ebenfalls vorbereitet.
Diese Übung ist Teil des Kurses
ML-Vorstellungsgespräche in Python üben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create empty list
sum_of_squared_distances = ____