Extraction des étiquettes de cluster
Dans l'exercice précédent, vous avez observé que le regroupement intermédiaire des échantillons de grains à la hauteur 6 comporte 3 grappes. À présent, veuillez utiliser la fonction « fcluster()
» (Étiquettes de cluster) pour extraire les étiquettes de cluster pour ce regroupement intermédiaire, puis comparez les étiquettes avec les variétés de céréales à l'aide d'un tableau croisé.
Le regroupement hiérarchique a déjà été effectué et mergings
est le résultat de la fonction linkage()
. La liste varieties
indique la variété de chaque échantillon de céréales.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
Importation :
pandas
pd
.fcluster
Extrait descipy.cluster.hierarchy
.
Effectuez un regroupement hiérarchique plat à l'aide de la fonction «
fcluster()
» surmergings
. Veuillez spécifier une hauteur maximale de6
et l'argument clécriterion='distance'
.Créez un DataFrame
df
avec deux colonnes nommées «'labels'
» et «'varieties'
», en utilisant respectivementlabels
etvarieties
pour les valeurs des colonnes. Cela a été fait pour vous.Créez un tableau croisé
ct
entredf['labels']
etdf['varieties']
afin de compter le nombre de fois où chaque variété de céréales coïncide avec chaque étiquette de cluster.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)