ComenzarEmpieza gratis

Extraer las etiquetas de los clústeres

En el ejercicio anterior, has visto que la agrupación intermedia de las muestras de grano a la altura 6 tiene 3 agrupaciones. Ahora, utiliza la función fcluster() para extraer las etiquetas de los clústeres de esta agrupación intermedia, y compara las etiquetas con las variedades de grano mediante una tabulación cruzada.

Ya se ha realizado la agrupación jerárquica y mergings es el resultado de la función linkage(). La lista varieties indica la variedad de cada muestra de grano.

Este ejercicio forma parte del curso

Aprendizaje no supervisado en Python

Ver curso

Instrucciones de ejercicio

  • Importa:

    • pandas como pd.

    • fcluster de scipy.cluster.hierarchy.

  • Realiza una agrupación jerárquica plana utilizando la función fcluster() en mergings. Especifica una altura máxima de 6 y el argumento de la palabra clave criterion='distance'.

  • Crea un DataFrame df con dos columnas llamadas 'labels' y 'varieties', utilizando labels y varieties, respectivamente, para los valores de las columnas. Esto se te proporciona hecho.

  • Crea una tabulación cruzada ct entre df['labels'] y df['varieties'] para contar el número de veces que cada variedad de grano coincide con cada etiqueta de clúster.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Perform the necessary imports
import ____ as ____
from ____ import ____

# Use fcluster to extract labels: labels
labels = ____

# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Editar y ejecutar código