Combien de clusters pour les grains ?
Dans la vidéo, vous avez appris à choisir un nombre approprié de clusters pour un ensemble de données à l'aide du graphique d'inertie k-means. Vous disposez d'un tableau samples contenant les mesures (telles que la surface, le périmètre, la longueur et plusieurs autres) d'échantillons de céréales. Quel est le nombre approprié de clusters dans ce cas ?
KMeans et PyPlot (plt) ont déjà été importés pour vous.
Cet ensemble de données provient du référentiel d'apprentissage automatique de l'UCI.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Pour chacune des valeurs données de
k, veuillez suivre les étapes suivantes : - Créez une instance
KMeansappeléemodelaveckclusters. - Ajustez le modèle aux données granulaires
samples. - Ajoutez la valeur de l'attribut
inertia_demodelà la listeinertias. - Le code permettant de tracer
kspar rapport àinertiasa été écrit pour vous, veuillez donc cliquer sur « Soumettre » pour voir le graphique.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()