Estrarre le etichette dei cluster
Nell'esercizio precedente, hai visto che il clustering intermedio dei campioni di cereali all'altezza 6 ha 3 cluster. Ora, usa la funzione fcluster() per estrarre le etichette dei cluster per questo clustering intermedio e confronta le etichette con le varietà di cereali usando una tabella a doppia entrata.
Il clustering gerarchico è già stato eseguito e mergings è il risultato della funzione linkage(). La lista varieties indica la varietà di ciascun campione di cereale.
Questo esercizio fa parte del corso
Apprendimento non supervisionato in Python
Istruzioni dell'esercizio
- Importa:
pandascomepd.fclusterdascipy.cluster.hierarchy.
- Esegui un clustering gerarchico piatto usando la funzione
fcluster()sumergings. Specifica un'altezza massima di6e l'argomentocriterion='distance'. - Crea un DataFrame
dfcon due colonne chiamate'labels'e'varieties', usando rispettivamentelabelsevarietiescome valori delle colonne. Questo è già stato fatto per te. - Crea una tabella a doppia entrata
cttradf['labels']edf['varieties']per contare quante volte ciascuna varietà di cereale coincide con ciascuna etichetta di cluster.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)