Impacto de las semillas en clusters distintos
Has observado el impacto de las semillas en un conjunto de datos que no tenía grupos de clusters bien definidos. En este ejercicio, vas a explorar si las semillas afectan a los clusters en los datos de Comic Con, donde los clusters están bien definidos.
Los datos están almacenados en un DataFrame de pandas, comic_con. x_scaled e y_scaled son los nombres de las columnas con las coordenadas X e Y estandarizadas de las personas en un momento dado.
Este ejercicio forma parte del curso
Análisis de clústeres en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import random class
____
# Initialize seed
random.____(____)
# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)
# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()