ComenzarEmpieza gratis

Patrones de agrupación uniformes

Ahora que ya conoces el impacto de las semillas, veamos el sesgo de la agrupación k-means hacia la formación de agrupaciones uniformes.

Utilicemos un conjunto de datos parecido al ratón para nuestro siguiente ejercicio. Un conjunto de datos parecido a un ratón es un grupo de puntos que se asemejan a la cabeza de un ratón: tiene tres grupos de puntos dispuestos en círculos, uno para la cara y dos para las orejas de un ratón.

Este es el aspecto de un conjunto de datos típico de ratón(Fuente).

Los datos se almacenan en un DataFrame de pandas, mouse. x_scaled y y_scaled son los nombres de columna de las coordenadas X e Y normalizadas de los puntos de datos.

Este ejercicio forma parte del curso

Análisis de conglomerados en Python

Ver curso

Instrucciones de ejercicio

  • Importa las funciones kmeans y vq en SciPy.
  • Genera los centros de los conglomerados utilizando la función kmeans() con tres conglomerados.
  • Crea etiquetas de clúster con vq() con los centros de clúster generados anteriormente.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import the kmeans and vq functions
____

# Generate cluster centers
cluster_centers, distortion = ____

# Assign cluster labels
mouse['cluster_labels'], distortion_list = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = mouse)
plt.show()
Editar y ejecutar código