IniziaInizia gratis

Impatto dei semi sui cluster distinti

Hai notato l’impatto dei semi su un insieme di dati che non aveva gruppi di cluster ben definiti. In questo esercizio, verificherai se i semi influenzano i cluster nei dati di Comic Con, dove i cluster sono ben definiti.

I dati sono salvati in un DataFrame di pandas, comic_con. x_scaled e y_scaled sono i nomi delle colonne con le coordinate X e Y standardizzate delle persone in un dato momento.

Questo esercizio fa parte del corso

Analisi di cluster in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import random class
____

# Initialize seed
random.____(____)

# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)

# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Modifica ed esegui il codice