Agrupamento hierárquico aglomerativo

No último exercício, você viu como o número de clusters ao realizar K-means pode impactar seus resultados, permitindo que você discuta K-means em uma entrevista de Machine Learning. No entanto, outro modelo de agrupamento que você pode usar é o agrupamento hierárquico aglomerativo. Em Python, você pode obter o número ideal de clusters para essa técnica tanto visualmente quanto matematicamente. Você usará os módulos scipy e sklearn para fazer ambos.

Lembre-se de que selecionar o número ideal de clusters a partir de um dendrograma depende tanto do critério de ligação (linkage) quanto do limiar de distância. Aqui, você criará um dendrograma com a matriz X do diabetes e, em seguida, traçará uma linha imaginária na altura 1.50, contando o número de linhas verticais cruzadas para representar o número ideal de clusters para o seu algoritmo de agrupamento hierárquico daqui em diante.

Este exercício faz parte do curso

Praticando perguntas de entrevista de Machine Learning em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import hierarchical clustering libraries
import ____.____.____ as sch
from ____.____ import ____

Editar e executar o código