K-means-Clustering
In einem Machine-Learning-Vorstellungsgespräch könntest du gefragt werden, wie die Ausgabe des K-means-Clustering genutzt werden kann, um seine Leistung als bester Algorithmus zu bewerten.
In dieser Übung trainierst du K-means-Clustering. Mit dem Attribut .inertia_ vergleichst du Modelle mit unterschiedlichen Anzahlen an Clustern, k. Diese Information nutzt du dann in der nächsten Übung, um die Clusteranzahl zu beurteilen.
Zur Erinnerung: Die Zielvariable im diabetes-Datensatz ist progression.
Wo du dich in der Pipeline befindest:

Diese Übung ist Teil des Kurses
ML-Vorstellungsgespräche in Python üben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import module
from sklearn.cluster import KMeans
# Create feature matrix
X = diabetes.____("____", axis=1)
# Instantiate
kmeans = KMeans(n_clusters=2, random_state=123)
# Fit
fit = kmeans.____(____)
# Print inertia
print("Sum of squared distances for 2 clusters is", kmeans.inertia_)