Méthode du coude
Les méthodes du score de silhouette et du coude permettent de valider les résultats observés avec chacune d’elles. En entretien Machine Learning, on peut vous interroger sur l’une ou l’autre ; expliquer les spécificités de l’une dans le contexte de l’autre renforcera considérablement votre réponse.
Dans cet exercice, pour chaque valeur de k, vous initialiserez un modèle K-means et utiliserez l’attribut inertia_ pour identifier la somme des distances au carré des échantillons jusqu’au centre du cluster le plus proche. Une fois tracée, cette courbe présente généralement un « coude ».
Rappelez-vous dans la leçon précédente que lorsque la valeur de k augmente, la valeur de inertia_ diminue.
Sont déjà importés pour vous : matplotlib.pyplot sous le nom plt et KMeans depuis sklearn.cluster. La matrice de caractéristiques X a également été créée pour vous.
Cet exercice fait partie du cours
S’entraîner aux questions d’entretien en Machine Learning avec Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create empty list
sum_of_squared_distances = ____