Extraction des étiquettes de cluster
Dans l'exercice précédent, vous avez observé que le regroupement intermédiaire des échantillons de grains à la hauteur 6 comporte 3 grappes. À présent, veuillez utiliser la fonction « fcluster() » (Étiquettes de cluster) pour extraire les étiquettes de cluster pour ce regroupement intermédiaire, puis comparez les étiquettes avec les variétés de céréales à l'aide d'un tableau croisé.
Le regroupement hiérarchique a déjà été effectué et mergings est le résultat de la fonction linkage(). La liste varieties indique la variété de chaque échantillon de céréales.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
Importation :
pandaspd.fclusterExtrait descipy.cluster.hierarchy.
Effectuez un regroupement hiérarchique plat à l'aide de la fonction «
fcluster()» surmergings. Veuillez spécifier une hauteur maximale de6et l'argument clécriterion='distance'.Créez un DataFrame
dfavec deux colonnes nommées «'labels'» et «'varieties'», en utilisant respectivementlabelsetvarietiespour les valeurs des colonnes. Cela a été fait pour vous.Créez un tableau croisé
ctentredf['labels']etdf['varieties']afin de compter le nombre de fois où chaque variété de céréales coïncide avec chaque étiquette de cluster.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)