Extraer las etiquetas de los clústeres
En el ejercicio anterior, has visto que la agrupación intermedia de las muestras de grano a la altura 6 tiene 3 agrupaciones. Ahora, utiliza la función fcluster()
para extraer las etiquetas de los clústeres de esta agrupación intermedia, y compara las etiquetas con las variedades de grano mediante una tabulación cruzada.
Ya se ha realizado la agrupación jerárquica y mergings
es el resultado de la función linkage()
. La lista varieties
indica la variedad de cada muestra de grano.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones de ejercicio
Importa:
pandas
comopd
.fcluster
descipy.cluster.hierarchy
.
Realiza una agrupación jerárquica plana utilizando la función
fcluster()
enmergings
. Especifica una altura máxima de6
y el argumento de la palabra clavecriterion='distance'
.Crea un DataFrame
df
con dos columnas llamadas'labels'
y'varieties'
, utilizandolabels
yvarieties
, respectivamente, para los valores de las columnas. Esto se te proporciona hecho.Crea una tabulación cruzada
ct
entredf['labels']
ydf['varieties']
para contar el número de veces que cada variedad de grano coincide con cada etiqueta de clúster.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)