Agrupamento K-means

Em uma entrevista de Machine Learning, é possível que perguntem como a saída do agrupamento K-means pode ser usada para avaliar seu desempenho como o melhor algoritmo.

Neste exercício, você vai praticar o agrupamento K-means. Usando o atributo .inertia_ para comparar modelos com diferentes números de clusters, k, você também usará essas informações para avaliar o número de clusters no próximo exercício.

Lembre-se de que a variável-alvo no conjunto de dados diabetes é progression.

Onde você está no pipeline:

Machine learning pipeline

Este exercício faz parte do curso

Praticando perguntas de entrevista de Machine Learning em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import module
from sklearn.cluster import KMeans

# Create feature matrix
X = diabetes.____("____", axis=1)

# Instantiate
kmeans = KMeans(n_clusters=2, random_state=123)

# Fit
fit = kmeans.____(____)

# Print inertia
print("Sum of squared distances for 2 clusters is", kmeans.inertia_)

Editar e executar o código