ComenzarEmpieza gratis

Impacto de las semillas en los distintos grupos

Te diste cuenta del impacto de las semillas en un conjunto de datos que no tenía grupos de conglomerados bien definidos. En este ejercicio, explorarás si las semillas influyen en los conglomerados de los datos de la Comic Con, donde los conglomerados están bien definidos.

Los datos se almacenan en un DataFrame de pandas, comic_con. x_scaled y y_scaled son los nombres de columna de las coordenadas X e Y normalizadas de las personas en un momento dado.

Este ejercicio forma parte del curso

Análisis de conglomerados en Python

Ver curso

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import random class
____

# Initialize seed
random.____(____)

# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)

# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Editar y ejecutar código