Clustering con K-means
En una entrevista de Machine Learning, podrían preguntarte cómo usarías la salida de un clustering con K-means para evaluar si es el mejor algoritmo.
En este ejercicio practicarás K-means. Usando el atributo .inertia_ para comparar modelos con distintos números de clusters, k, también utilizarás esta información para evaluar el número de clusters en el siguiente ejercicio.
Recuerda que la variable objetivo en el conjunto de datos diabetes es progression.
Dónde estás en el flujo de trabajo:

Este ejercicio forma parte del curso
Practicing Machine Learning Interview Questions in Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import module
from sklearn.cluster import KMeans
# Create feature matrix
X = diabetes.____("____", axis=1)
# Instantiate
kmeans = KMeans(n_clusters=2, random_state=123)
# Fit
fit = kmeans.____(____)
# Print inertia
print("Sum of squared distances for 2 clusters is", kmeans.inertia_)