ComenzarEmpieza gratis

Impacto de las semillas en clusters distintos

Has observado el impacto de las semillas en un conjunto de datos que no tenía grupos de clusters bien definidos. En este ejercicio, vas a explorar si las semillas afectan a los clusters en los datos de Comic Con, donde los clusters están bien definidos.

Los datos están almacenados en un DataFrame de pandas, comic_con. x_scaled e y_scaled son los nombres de las columnas con las coordenadas X e Y estandarizadas de las personas en un momento dado.

Este ejercicio forma parte del curso

Análisis de clústeres en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import random class
____

# Initialize seed
random.____(____)

# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)

# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Editar y ejecutar código