Combien de grappes de grains ?
Dans cette vidéo, vous avez appris à sélectionner un nombre approprié de clusters pour un ensemble de données à l'aide du graphique d'inertie k-means. On vous fournit un tableau samples
contenant les mesures (telles que la surface, le périmètre, la longueur et plusieurs autres) d'échantillons de céréales. Quel est le nombre approprié de clusters dans ce cas ?
KMeans
et PyPlot (plt
) ont déjà été importés pour vous.
Cet ensemble de données provient du référentiel UCI Machine Learning Repository.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
Pour chacune des valeurs données d'
k
, procédez comme suit :Créez une instance d'
KMeans
appeléemodel
avec des clustersk
.Ajustez le modèle aux données granulométriques.
samples
.Ajoutez la valeur de l'attribut
inertia_
demodel
à la listeinertias
.Le code permettant de représenter graphiquement l'
ks
e en fonction de l'inertias
e a été écrit pour vous. Veuillez cliquer sur « Soumettre » pour afficher le graphique.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()