Agrupación de K-means: primer ejercicio
Este ejercicio te familiarizará con el uso de la agrupación de k-means en un conjunto de datos. Utilicemos el conjunto de datos Comic Con y comprobemos cómo funciona la agrupación de k-means en él.
Recuerda los dos pasos de la agrupación de k-means:
- Define los centros de los conglomerados mediante la función
kmeans()
. Tiene dos argumentos obligatorios: observaciones y número de conglomerados. - Asigna etiquetas a los grupos mediante la función
vq()
. Tiene dos argumentos necesarios: observaciones y centros de conglomerados.
Los datos se almacenan en un DataFrame de pandas, comic_con
. x_scaled
y y_scaled
son los nombres de columna de las coordenadas X e Y normalizadas de las personas en un momento dado.
Este ejercicio forma parte del curso
Análisis de conglomerados en Python
Instrucciones de ejercicio
- Importa las funciones
kmeans
yvq
en SciPy. - Genera los centros de los conglomerados utilizando la función
kmeans()
con dos conglomerados. - Crea etiquetas de conglomerado utilizando estos centros de conglomerado.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import the kmeans and vq functions
from ____.cluster.vq import ____, ____
# Generate cluster centers
cluster_centers, distortion = ____
# Assign cluster labels
comic_con['cluster_labels'], distortion_list = ____
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()