¿Cuántos clústeres de grano?
En el vídeo, aprendiste a elegir un buen número de clústeres para un conjunto de datos utilizando el gráfico de inercia de k-medias. Se te da una matriz samples que contiene las medidas (como área, perímetro, longitud y varias otras) de muestras de grano. ¿Cuál es un buen número de grupos en este caso?
KMeans y PyPlot (plt) ya se han importado para ti.
Este conjunto de datos se obtuvo del Repositorio de Machine Learning de la UCI.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones del ejercicio
Para cada uno de los valores dados de
k, realiza los pasos siguientes:Crea una instancia de
KMeansllamadamodelcon clústeresk.Ajusta el modelo a los
samplesde los datos del grano.Añade el valor del atributo
inertia_demodela la listainertias.El código para representar
ksfrente ainertiasya está escrito, así que pulsa enviar para ver el gráfico.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()