Metodo del gomito su cluster distinti
Usiamo il dataset di comic con per vedere come appare il grafico del gomito su un insieme di dati con cluster distinti e ben definiti. Potresti voler visualizzare i punti dati prima di procedere con l'esercizio.
I dati sono memorizzati in un DataFrame di pandas, comic_con. x_scaled e y_scaled sono i nomi delle colonne con le coordinate X e Y standardizzate delle persone in un dato momento.
Questo esercizio fa parte del corso
Analisi di cluster in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
distortions = []
num_clusters = range(1, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
distortions.append(distortion)
# Create a DataFrame with two lists - num_clusters, distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})
# Creat a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = ____)
plt.xticks(num_clusters)
plt.show()