1. Apprendre
  2. /
  3. Cours
  4. /
  5. Unsupervised Learning in Python

Connected

Exercice

Extraire les étiquettes de grappes

Dans l'exercice précédent, vous avez vu que le regroupement intermédiaire des échantillons de grains à la hauteur 6 comporte 3 grappes. Maintenant, utilisez la fonction fcluster() pour extraire les étiquettes de grappes pour ce regroupement intermédiaire, puis comparez ces étiquettes aux variétés de grains à l'aide d'un tableau croisé.

Le regroupement hiérarchique a déjà été effectué et mergings est le résultat de la fonction linkage(). La liste varieties donne la variété de chaque échantillon de grain.

Instructions

100 XP
  • Importez :
    • pandas sous le nom pd.
    • fcluster depuis scipy.cluster.hierarchy.
  • Effectuez un regroupement hiérarchique aplati en utilisant la fonction fcluster() sur mergings. Indiquez une hauteur maximale de 6 et l'argument nommé criterion='distance'.
  • Créez un DataFrame df avec deux colonnes nommées 'labels' et 'varieties', en utilisant respectivement labels et varieties comme valeurs de colonnes. Cela a été fait pour vous.
  • Créez un tableau croisé ct entre df['labels'] et df['varieties'] pour compter le nombre de fois où chaque variété de grain correspond à chaque étiquette de grappe.