Méthode du coude sur des données uniformes
Dans l’exercice précédent, vous avez construit un graphique du coude sur des données avec des clusters bien définis. Observons maintenant à quoi ressemble ce graphique pour un jeu de données où les points sont répartis uniformément. Vous pouvez afficher les points de données avant de commencer l’exercice.
Les données sont stockées dans un DataFrame pandas, uniform_data. x_scaled et y_scaled sont les noms de colonnes des coordonnées X et Y standardisées des points.
Cet exercice fait partie du cours
Analyse de clusters en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
distortions = []
num_clusters = range(2, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
____.append(____)
# Create a DataFrame with two lists - number of clusters and distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})
# Creat a line plot of num_clusters and distortions
sns.____(x=____, y=____, data=____)
plt.xticks(num_clusters)
plt.show()