CommencerCommencer gratuitement

Extraction des étiquettes de cluster

Dans l'exercice précédent, vous avez observé que le regroupement intermédiaire des échantillons de céréales à la hauteur 6 comporte 3 clusters. À présent, veuillez utiliser la fonction fcluster() pour extraire les étiquettes des clusters pour ce regroupement intermédiaire, puis comparez les étiquettes avec les variétés de céréales à l'aide d'un tableau croisé.

Le regroupement hiérarchique a déjà été effectué et mergings est le résultat de la fonction linkage(). La liste varieties indique la variété de chaque échantillon de céréales.

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Importation :
    • pandas comme pd.
    • fcluster depuis scipy.cluster.hierarchy.
  • Effectuez un regroupement hiérarchique plat en utilisant la fonction fcluster() sur mergings. Spécifiez une hauteur maximale de 6 et l'argument clé criterion='distance'.
  • Créez un DataFrame df avec deux colonnes nommées 'labels' et 'varieties', en utilisant respectivement labels et varieties pour les valeurs des colonnes. Cette opération a été effectuée pour vous.
  • Créez un tableau croisé ct entre df['labels'] et df['varieties'] afin de compter le nombre de fois où chaque variété de céréales coïncide avec chaque étiquette de cluster.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Perform the necessary imports
import ____ as ____
from ____ import ____

# Use fcluster to extract labels: labels
labels = ____

# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Modifier et exécuter le code