CommencerCommencer gratuitement

Méthode du coude sur des données uniformes

Dans l’exercice précédent, vous avez construit un graphique du coude sur des données avec des clusters bien définis. Observons maintenant à quoi ressemble ce graphique pour un jeu de données où les points sont répartis uniformément. Vous pouvez afficher les points de données avant de commencer l’exercice.

Les données sont stockées dans un DataFrame pandas, uniform_data. x_scaled et y_scaled sont les noms de colonnes des coordonnées X et Y standardisées des points.

Cet exercice fait partie du cours

Analyse de clusters en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

distortions = []
num_clusters = range(2, 7)

# Create a list of distortions from the kmeans function
for i in ____:
    cluster_centers, distortion = ____
    ____.append(____)

# Create a DataFrame with two lists - number of clusters and distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})

# Creat a line plot of num_clusters and distortions
sns.____(x=____, y=____, data=____)
plt.xticks(num_clusters)
plt.show()
Modifier et exécuter le code