¿Cuántos clústeres de grano?
En el vídeo, aprendiste a elegir un buen número de clústeres para un conjunto de datos utilizando el gráfico de inercia de k-medias. Se te da una matriz samples
que contiene las medidas (como área, perímetro, longitud y varias otras) de muestras de grano. ¿Cuál es un buen número de grupos en este caso?
KMeans
y PyPlot (plt
) ya se han importado para ti.
Este conjunto de datos procede del Repositorio de Machine LearningUCI .
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones de ejercicio
Para cada uno de los valores dados de
k
, realiza los pasos siguientes:Crea una instancia de
KMeans
llamadamodel
con clústeresk
.Ajusta el modelo a los
samples
de los datos del grano.Añade el valor del atributo
inertia_
demodel
a la listainertias
.El código para representar
ks
frente ainertias
ya está escrito, así que pulsa enviar para ver el gráfico.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()