CommencerCommencer gratuitement

Combien de clusters pour les grains ?

Dans la vidéo, vous avez appris à choisir un nombre approprié de clusters pour un ensemble de données à l'aide du graphique d'inertie k-means. Vous disposez d'un tableau samples contenant les mesures (telles que la surface, le périmètre, la longueur et plusieurs autres) d'échantillons de céréales. Quel est le nombre approprié de clusters dans ce cas ?

KMeans et PyPlot (plt) ont déjà été importés pour vous.

Cet ensemble de données provient du référentiel d'apprentissage automatique de l'UCI.

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Pour chacune des valeurs données de k, veuillez suivre les étapes suivantes :
  • Créez une instance KMeans appelée model avec k clusters.
  • Ajustez le modèle aux données granulaires samples.
  • Ajoutez la valeur de l'attribut inertia_ de model à la liste inertias.
  • Le code permettant de tracer ks par rapport à inertias a été écrit pour vous, veuillez donc cliquer sur « Soumettre » pour voir le graphique.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Modifier et exécuter le code