CommencerCommencer gratuitement

Méthode du coude sur des clusters distincts

Utilisons le jeu de données comic con pour voir à quoi ressemble la courbe du coude sur un jeu de données avec des groupes distincts et bien définis. Vous pouvez afficher les points de données avant de commencer l’exercice.

Les données sont stockées dans un DataFrame pandas, comic_con. x_scaled et y_scaled sont les noms des colonnes contenant les coordonnées X et Y standardisées des personnes à un instant donné.

Cet exercice fait partie du cours

Analyse de clusters en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

distortions = []
num_clusters = range(1, 7)

# Create a list of distortions from the kmeans function
for i in ____:
    cluster_centers, distortion = ____
    distortions.append(distortion)

# Create a DataFrame with two lists - num_clusters, distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})

# Creat a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = ____)
plt.xticks(num_clusters)
plt.show()
Modifier et exécuter le code