Impacto de las semillas en los distintos grupos
Te diste cuenta del impacto de las semillas en un conjunto de datos que no tenía grupos de conglomerados bien definidos. En este ejercicio, explorarás si las semillas influyen en los conglomerados de los datos de la Comic Con, donde los conglomerados están bien definidos.
Los datos se almacenan en un DataFrame de pandas, comic_con
. x_scaled
y y_scaled
son los nombres de columna de las coordenadas X e Y normalizadas de las personas en un momento dado.
Este ejercicio forma parte del curso
Análisis de conglomerados en Python
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import random class
____
# Initialize seed
random.____(____)
# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)
# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()