Extraction des étiquettes de cluster
Dans l'exercice précédent, vous avez observé que le regroupement intermédiaire des échantillons de céréales à la hauteur 6 comporte 3 clusters. À présent, veuillez utiliser la fonction fcluster() pour extraire les étiquettes des clusters pour ce regroupement intermédiaire, puis comparez les étiquettes avec les variétés de céréales à l'aide d'un tableau croisé.
Le regroupement hiérarchique a déjà été effectué et mergings est le résultat de la fonction linkage(). La liste varieties indique la variété de chaque échantillon de céréales.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Importation :
pandascommepd.fclusterdepuisscipy.cluster.hierarchy.
- Effectuez un regroupement hiérarchique plat en utilisant la fonction
fcluster()surmergings. Spécifiez une hauteur maximale de6et l'argument clécriterion='distance'. - Créez un DataFrame
dfavec deux colonnes nommées'labels'et'varieties', en utilisant respectivementlabelsetvarietiespour les valeurs des colonnes. Cette opération a été effectuée pour vous. - Créez un tableau croisé
ctentredf['labels']etdf['varieties']afin de compter le nombre de fois où chaque variété de céréales coïncide avec chaque étiquette de cluster.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)