CommencerCommencer gratuitement

Extraction des étiquettes de cluster

Dans l'exercice précédent, vous avez observé que le regroupement intermédiaire des échantillons de grains à la hauteur 6 comporte 3 grappes. À présent, veuillez utiliser la fonction « fcluster() » (Étiquettes de cluster) pour extraire les étiquettes de cluster pour ce regroupement intermédiaire, puis comparez les étiquettes avec les variétés de céréales à l'aide d'un tableau croisé.

Le regroupement hiérarchique a déjà été effectué et mergings est le résultat de la fonction linkage(). La liste varieties indique la variété de chaque échantillon de céréales.

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Importation :

    • pandas pd.

    • fcluster Extrait de scipy.cluster.hierarchy.

  • Effectuez un regroupement hiérarchique plat à l'aide de la fonction « fcluster() » sur mergings. Veuillez spécifier une hauteur maximale de 6 et l'argument clé criterion='distance'.

  • Créez un DataFrame df avec deux colonnes nommées « 'labels' » et « 'varieties' », en utilisant respectivement labels et varieties pour les valeurs des colonnes. Cela a été fait pour vous.

  • Créez un tableau croisé ct entre df['labels'] et df['varieties'] afin de compter le nombre de fois où chaque variété de céréales coïncide avec chaque étiquette de cluster.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Perform the necessary imports
import ____ as ____
from ____ import ____

# Use fcluster to extract labels: labels
labels = ____

# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Modifier et exécuter le code