ComenzarEmpieza gratis

Patrones de clustering uniformes

Ahora que ya conoces el impacto de las semillas, veamos el sesgo de k-means hacia la formación de clusters uniformes.

Para el siguiente ejercicio usaremos un conjunto de datos con forma de ratón. Un conjunto de datos con forma de ratón es un grupo de puntos que recuerda a la cabeza de un ratón: tiene tres clusters de puntos dispuestos en círculos, uno para la cara y dos para las orejas.

Así es como suele verse un conjunto de datos con forma de ratón (Fuente).

Los datos están almacenados en un DataFrame de pandas, mouse. x_scaled e y_scaled son los nombres de las columnas con las coordenadas X e Y estandarizadas de los puntos.

Este ejercicio forma parte del curso

Análisis de clústeres en Python

Ver curso

Instrucciones del ejercicio

  • Importa las funciones kmeans y vq de SciPy.
  • Genera los centros de los clusters usando la función kmeans() con tres clusters.
  • Crea las etiquetas de cluster con vq() usando los centros generados arriba.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import the kmeans and vq functions
____

# Generate cluster centers
cluster_centers, distortion = ____

# Assign cluster labels
mouse['cluster_labels'], distortion_list = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = mouse)
plt.show()
Editar y ejecutar código