Impacto das sementes em grupos distintos
Você notou o impacto das sementes em um conjunto de dados que não tinha grupos de clusters bem definidos. Neste exercício, você explorará se as sementes afetam os clusters nos dados da Comic Con, onde os clusters são bem definidos.
Os dados são armazenados em um DataFrame do pandas, comic_con
. x_scaled
e y_scaled
são os nomes das colunas das coordenadas X e Y padronizadas das pessoas em um determinado momento.
Este exercício faz parte do curso
Análise de cluster em Python
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import random class
____
# Initialize seed
random.____(____)
# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)
# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()