Impatto dei semi sui cluster distinti
Hai notato l’impatto dei semi su un insieme di dati che non aveva gruppi di cluster ben definiti. In questo esercizio, verificherai se i semi influenzano i cluster nei dati di Comic Con, dove i cluster sono ben definiti.
I dati sono salvati in un DataFrame di pandas, comic_con. x_scaled e y_scaled sono i nomi delle colonne con le coordinate X e Y standardizzate delle persone in un dato momento.
Questo esercizio fa parte del corso
Analisi di cluster in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import random class
____
# Initialize seed
random.____(____)
# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)
# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()