1. Apprendre
  2. /
  3. Cours
  4. /
  5. Unsupervised Learning in Python

Connected

Exercice

Évaluer le regroupement des grains

Dans l'exercice précédent, vous avez vu sur le graphique de l'inertie que 3 est un bon nombre de clusters pour les données de grains. En fait, les échantillons de grains proviennent d'un mélange de 3 variétés différentes : « Kama », « Rosa » et « Canadian ». Dans cet exercice, regroupez les échantillons de grains en trois clusters et comparez ces clusters aux variétés de grains à l'aide d'un tableau croisé.

Vous disposez du tableau samples contenant les échantillons de grains et d'une liste varieties indiquant la variété de chaque échantillon. Pandas (pd) et KMeans ont déjà été importés pour vous.

Instructions

100 XP
  • Créez un modèle KMeans appelé model avec 3 clusters.
  • Utilisez la méthode .fit_predict() de model pour l'entraîner sur samples et obtenir les étiquettes de cluster. Utiliser .fit_predict() revient à utiliser .fit() puis .predict().
  • Créez un DataFrame df avec deux colonnes nommées 'labels' et 'varieties', en utilisant respectivement labels et varieties comme valeurs de colonnes. Cela a été fait pour vous.
  • Utilisez la fonction pd.crosstab() sur df['labels'] et df['varieties'] pour compter le nombre de fois où chaque variété de grain coïncide avec chaque étiquette de cluster. Assignez le résultat à ct.
  • Appuyez sur Soumettre pour voir le tableau croisé !