Extração dos rótulos de cluster
No exercício anterior, você viu que o agrupamento intermediário das amostras de grãos na altura 6 tem 3 agrupamentos. Agora, use a função fcluster() para extrair os rótulos de cluster para esse agrupamento intermediário e compare os rótulos com as variedades de grãos usando uma tabulação cruzada.
O agrupamento hierárquico já foi realizado e mergings é o resultado da função linkage(). A lista varieties apresenta a variedade de cada amostra de grão.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
Importação:
pandascomopd.fclusterdescipy.cluster.hierarchy.
Execute um agrupamento hierárquico plano usando a função
fcluster()emmergings. Especifique uma altura máxima de6e o argumento de palavra-chavecriterion='distance'.Crie um DataFrame
dfcom duas colunas denominadas'labels'e'varieties', usandolabelsevarieties, respectivamente, para os valores das colunas. Isso foi feito para você.Crie uma tabulação cruzada
ctentredf['labels']edf['varieties']para contar o número de vezes que cada variedade de grão coincide com cada rótulo de cluster.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)