CommencerCommencez gratuitement

Extraction des étiquettes de cluster

Dans l'exercice précédent, vous avez observé que le regroupement intermédiaire des échantillons de céréales à la hauteur 6 comporte 3 clusters. À présent, veuillez utiliser la fonction fcluster() pour extraire les étiquettes des clusters pour ce regroupement intermédiaire, puis comparez les étiquettes avec les variétés de céréales à l'aide d'un tableau croisé.

Le regroupement hiérarchique a déjà été effectué et mergings est le résultat de la fonction linkage(). La liste varieties indique la variété de chaque échantillon de céréales.

Cet exercice fait partie du cours

<cours>Apprentissage non supervisé en Python</cours>
Voir le cours

Instructions de l’exercice

  • Importation :
    • pandas comme pd.
    • fcluster depuis scipy.cluster.hierarchy.
  • Effectuez un regroupement hiérarchique plat en utilisant la fonction fcluster() sur mergings. Spécifiez une hauteur maximale de 6 et l'argument clé criterion='distance'.
  • Créez un DataFrame df avec deux colonnes nommées 'labels' et 'varieties', en utilisant respectivement labels et varieties pour les valeurs des colonnes. Cette opération a été effectuée pour vous.
  • Créez un tableau croisé ct entre df['labels'] et df['varieties'] afin de compter le nombre de fois où chaque variété de céréales coïncide avec chaque étiquette de cluster.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Perform the necessary imports
import ____ as ____
from ____ import ____

# Use fcluster to extract labels: labels
labels = ____

# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Modifier et exécuter le code