¿Cuántos clústeres de grano?
En el vídeo, aprendiste a elegir un buen número de clústeres para un conjunto de datos utilizando el gráfico de inercia de k-medias. Se te da una matriz samples
que contiene las medidas (como área, perímetro, longitud y varias otras) de muestras de grano. ¿Cuál es un buen número de grupos en este caso?
KMeans
y PyPlot (plt
) ya se han importado para ti.
Este conjunto de datos se obtuvo del Repositorio de Machine Learning de la UCI.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones del ejercicio
Para cada uno de los valores dados de
k
, realiza los pasos siguientes:Crea una instancia de
KMeans
llamadamodel
con clústeresk
.Ajusta el modelo a los
samples
de los datos del grano.Añade el valor del atributo
inertia_
demodel
a la listainertias
.El código para representar
ks
frente ainertias
ya está escrito, así que pulsa enviar para ver el gráfico.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()