K-means-Clustering

In einem Machine-Learning-Vorstellungsgespräch könntest du gefragt werden, wie die Ausgabe des K-means-Clustering genutzt werden kann, um seine Leistung als bester Algorithmus zu bewerten.

In dieser Übung trainierst du K-means-Clustering. Mit dem Attribut .inertia_ vergleichst du Modelle mit unterschiedlichen Anzahlen an Clustern, k. Diese Information nutzt du dann in der nächsten Übung, um die Clusteranzahl zu beurteilen.

Zur Erinnerung: Die Zielvariable im diabetes-Datensatz ist progression.

Wo du dich in der Pipeline befindest:

Machine learning pipeline

Diese Übung ist Teil des Kurses

ML-Vorstellungsgespräche in Python üben

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import module
from sklearn.cluster import KMeans

# Create feature matrix
X = diabetes.____("____", axis=1)

# Instantiate
kmeans = KMeans(n_clusters=2, random_state=123)

# Fit
fit = kmeans.____(____)

# Print inertia
print("Sum of squared distances for 2 clusters is", kmeans.inertia_)

Code bearbeiten und ausführen