Patrones de agrupación uniformes
Ahora que ya conoces el impacto de las semillas, veamos el sesgo de la agrupación k-means hacia la formación de agrupaciones uniformes.
Utilicemos un conjunto de datos parecido al ratón para nuestro siguiente ejercicio. Un conjunto de datos parecido a un ratón es un grupo de puntos que se asemejan a la cabeza de un ratón: tiene tres grupos de puntos dispuestos en círculos, uno para la cara y dos para las orejas de un ratón.
Este es el aspecto de un conjunto de datos típico de ratón(Fuente).
Los datos se almacenan en un DataFrame de pandas, mouse
. x_scaled
y y_scaled
son los nombres de columna de las coordenadas X e Y normalizadas de los puntos de datos.
Este ejercicio forma parte del curso
Análisis de conglomerados en Python
Instrucciones de ejercicio
- Importa las funciones
kmeans
yvq
en SciPy. - Genera los centros de los conglomerados utilizando la función
kmeans()
con tres conglomerados. - Crea etiquetas de clúster con
vq()
con los centros de clúster generados anteriormente.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import the kmeans and vq functions
____
# Generate cluster centers
cluster_centers, distortion = ____
# Assign cluster labels
mouse['cluster_labels'], distortion_list = ____
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = mouse)
plt.show()