Extraction des étiquettes de cluster
Dans l'exercice précédent, vous avez observé que le regroupement intermédiaire des échantillons de céréales à la hauteur 6 comporte 3 clusters. À présent, veuillez utiliser la fonction fcluster() pour extraire les étiquettes des clusters pour ce regroupement intermédiaire, puis comparez les étiquettes avec les variétés de céréales à l'aide d'un tableau croisé.
Le regroupement hiérarchique a déjà été effectué et mergings est le résultat de la fonction linkage(). La liste varieties indique la variété de chaque échantillon de céréales.
Cet exercice fait partie du cours
<cours>Apprentissage non supervisé en Python</cours>Instructions de l’exercice
- Importation :
pandascommepd.fclusterdepuisscipy.cluster.hierarchy.
- Effectuez un regroupement hiérarchique plat en utilisant la fonction
fcluster()surmergings. Spécifiez une hauteur maximale de6et l'argument clécriterion='distance'. - Créez un DataFrame
dfavec deux colonnes nommées'labels'et'varieties', en utilisant respectivementlabelsetvarietiespour les valeurs des colonnes. Cette opération a été effectuée pour vous. - Créez un tableau croisé
ctentredf['labels']etdf['varieties']afin de compter le nombre de fois où chaque variété de céréales coïncide avec chaque étiquette de cluster.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)