ComenzarEmpieza gratis

Agrupación de K-means: primer ejercicio

Este ejercicio te familiarizará con el uso de la agrupación de k-means en un conjunto de datos. Utilicemos el conjunto de datos Comic Con y comprobemos cómo funciona la agrupación de k-means en él.

Recuerda los dos pasos de la agrupación de k-means:

  • Define los centros de los conglomerados mediante la función kmeans(). Tiene dos argumentos obligatorios: observaciones y número de conglomerados.
  • Asigna etiquetas a los grupos mediante la función vq(). Tiene dos argumentos necesarios: observaciones y centros de conglomerados.

Los datos se almacenan en un DataFrame de pandas, comic_con. x_scaled y y_scaled son los nombres de columna de las coordenadas X e Y normalizadas de las personas en un momento dado.

Este ejercicio forma parte del curso

Análisis de conglomerados en Python

Ver curso

Instrucciones de ejercicio

  • Importa las funciones kmeans y vq en SciPy.
  • Genera los centros de los conglomerados utilizando la función kmeans() con dos conglomerados.
  • Crea etiquetas de conglomerado utilizando estos centros de conglomerado.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import the kmeans and vq functions
from ____.cluster.vq import ____, ____

# Generate cluster centers
cluster_centers, distortion = ____

# Assign cluster labels
comic_con['cluster_labels'], distortion_list = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Editar y ejecutar código