Clustering con K-means

En una entrevista de Machine Learning, podrían preguntarte cómo usarías la salida de un clustering con K-means para evaluar si es el mejor algoritmo.

En este ejercicio practicarás K-means. Usando el atributo .inertia_ para comparar modelos con distintos números de clusters, k, también utilizarás esta información para evaluar el número de clusters en el siguiente ejercicio.

Recuerda que la variable objetivo en el conjunto de datos diabetes es progression.

Dónde estás en el flujo de trabajo:

Flujo de trabajo de Machine Learning

Este ejercicio forma parte del curso

Practicing Machine Learning Interview Questions in Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import module
from sklearn.cluster import KMeans

# Create feature matrix
X = diabetes.____("____", axis=1)

# Instantiate
kmeans = KMeans(n_clusters=2, random_state=123)

# Fit
fit = kmeans.____(____)

# Print inertia
print("Sum of squared distances for 2 clusters is", kmeans.inertia_)

Editar y ejecutar código