ComeçarComece de graça

Extraindo os rótulos do cluster

No exercício anterior, você viu que o agrupamento intermediário das amostras de grãos na altura 6 tem 3 clusters. Agora, usa a função “ fcluster() ” para extrair os rótulos do cluster para este agrupamento intermediário e compara os rótulos com as variedades de grãos usando uma tabulação cruzada.

A agrupamento hierárquico já foi feito e mergings é o resultado da função linkage(). A lista varieties mostra a variedade de cada amostra de grãos.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Importar:

    • pandas como pd.

    • fcluster de scipy.cluster.hierarchy.

  • Faça um agrupamento hierárquico plano usando a função “ fcluster() ” em mergings. Diz a altura máxima de 6 e o argumento de palavra-chave criterion='distance'.

  • Crie um DataFrame chamado “ df ” com duas colunas chamadas “ 'labels' ” e “ 'varieties' ”, usando “ labels ” e “ varieties ”, respectivamente, para os valores das colunas. Isso foi feito para você.

  • Crie uma tabulação cruzada ct entre df['labels'] e df['varieties'] para contar quantas vezes cada tipo de grão aparece junto com cada rótulo de grupo.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Perform the necessary imports
import ____ as ____
from ____ import ____

# Use fcluster to extract labels: labels
labels = ____

# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Editar e executar o código