CommencerCommencer gratuitement

Combien de grappes de grains ?

Dans cette vidéo, vous avez appris à sélectionner un nombre approprié de clusters pour un ensemble de données à l'aide du graphique d'inertie k-means. On vous fournit un tableau samples contenant les mesures (telles que la surface, le périmètre, la longueur et plusieurs autres) d'échantillons de céréales. Quel est le nombre approprié de clusters dans ce cas ?

KMeans et PyPlot (plt) ont déjà été importés pour vous.

Cet ensemble de données provient du référentiel UCI Machine Learning Repository.

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Pour chacune des valeurs données d'k, procédez comme suit :

  • Créez une instance d'KMeans appelée model avec des clusters k.

  • Ajustez le modèle aux données granulométriques. samples.

  • Ajoutez la valeur de l'attribut inertia_ de model à la liste inertias.

  • Le code permettant de représenter graphiquement l'ks e en fonction de l'inertias e a été écrit pour vous. Veuillez cliquer sur « Soumettre » pour afficher le graphique.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Modifier et exécuter le code