Clustering jerárquico aglomerativo
En el último ejercicio, viste cómo el número de clústeres al realizar K-means podía afectar tus resultados, lo que te permite hablar de K-means en una entrevista de Machine Learning. Sin embargo, otro modelo de clustering que puedes usar es el clustering jerárquico aglomerativo. En Python, puedes obtener el número óptimo de clústeres para esta técnica tanto de forma visual como matemática. Usarás los módulos scipy y sklearn para ambos enfoques.
Recuerda que seleccionar el número óptimo de clústeres a partir de un dendrograma depende tanto del criterio de enlace como del umbral de distancia. Aquí, crearás un dendrograma con la matriz X de diabetes, luego extenderás una línea imaginaria en la longitud 1.50, contando el número de líneas verticales cruzadas para representar el número óptimo de clústeres para tu algoritmo de clustering jerárquico en adelante.
Este ejercicio forma parte del curso
Practicing Machine Learning Interview Questions in Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import hierarchical clustering libraries
import ____.____.____ as sch
from ____.____ import ____