ComenzarEmpieza gratis

¿Cuántos clústeres de grano?

En el vídeo, aprendiste a elegir un buen número de clústeres para un conjunto de datos utilizando el gráfico de inercia de k-medias. Se te da una matriz samples que contiene las medidas (como área, perímetro, longitud y varias otras) de muestras de grano. ¿Cuál es un buen número de grupos en este caso?

KMeans y PyPlot (plt) ya se han importado para ti.

Este conjunto de datos se obtuvo del Repositorio de Machine Learning de la UCI.

Este ejercicio forma parte del curso

Aprendizaje no supervisado en Python

Ver curso

Instrucciones del ejercicio

  • Para cada uno de los valores dados de k, realiza los pasos siguientes:

  • Crea una instancia de KMeans llamada model con clústeres k.

  • Ajusta el modelo a los samples de los datos del grano.

  • Añade el valor del atributo inertia_ de model a la lista inertias.

  • El código para representar ks frente a inertias ya está escrito, así que pulsa enviar para ver el gráfico.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Editar y ejecutar código