Extraer las etiquetas de los clústeres
En el ejercicio anterior, has visto que la agrupación intermedia de las muestras de grano a la altura 6 tiene 3 agrupaciones. Ahora, utiliza la función fcluster() para extraer las etiquetas de los clústeres de esta agrupación intermedia, y compara las etiquetas con las variedades de grano mediante una tabulación cruzada.
Ya se ha realizado la agrupación jerárquica y mergings es el resultado de la función linkage(). La lista varieties indica la variedad de cada muestra de grano.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones del ejercicio
Importa:
pandascomopd.fclusterdescipy.cluster.hierarchy.
Realiza una agrupación jerárquica plana utilizando la función
fcluster()enmergings. Especifica una altura máxima de6y el argumento de la palabra clavecriterion='distance'.Crea un DataFrame
dfcon dos columnas llamadas'labels'y'varieties', utilizandolabelsyvarieties, respectivamente, para los valores de las columnas. Esto se te proporciona hecho.Crea una tabulación cruzada
ctentredf['labels']ydf['varieties']para contar el número de veces que cada variedad de grano coincide con cada etiqueta de clúster.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)