Extraindo os rótulos do cluster
No exercício anterior, você viu que o agrupamento intermediário das amostras de grãos na altura 6 tem 3 clusters. Agora, usa a função “ fcluster()
” para extrair os rótulos do cluster para este agrupamento intermediário e compara os rótulos com as variedades de grãos usando uma tabulação cruzada.
A agrupamento hierárquico já foi feito e mergings
é o resultado da função linkage()
. A lista varieties
mostra a variedade de cada amostra de grãos.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
Importar:
pandas
comopd
.fcluster
descipy.cluster.hierarchy
.
Faça um agrupamento hierárquico plano usando a função “
fcluster()
” emmergings
. Diz a altura máxima de6
e o argumento de palavra-chavecriterion='distance'
.Crie um DataFrame chamado “
df
” com duas colunas chamadas “'labels'
” e “'varieties'
”, usando “labels
” e “varieties
”, respectivamente, para os valores das colunas. Isso foi feito para você.Crie uma tabulação cruzada
ct
entredf['labels']
edf['varieties']
para contar quantas vezes cada tipo de grão aparece junto com cada rótulo de grupo.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)