IniziaInizia gratis

Estrarre le etichette dei cluster

Nell'esercizio precedente, hai visto che il clustering intermedio dei campioni di cereali all'altezza 6 ha 3 cluster. Ora, usa la funzione fcluster() per estrarre le etichette dei cluster per questo clustering intermedio e confronta le etichette con le varietà di cereali usando una tabella a doppia entrata.

Il clustering gerarchico è già stato eseguito e mergings è il risultato della funzione linkage(). La lista varieties indica la varietà di ciascun campione di cereale.

Questo esercizio fa parte del corso

Apprendimento non supervisionato in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa:
    • pandas come pd.
    • fcluster da scipy.cluster.hierarchy.
  • Esegui un clustering gerarchico piatto usando la funzione fcluster() su mergings. Specifica un'altezza massima di 6 e l'argomento criterion='distance'.
  • Crea un DataFrame df con due colonne chiamate 'labels' e 'varieties', usando rispettivamente labels e varieties come valori delle colonne. Questo è già stato fatto per te.
  • Crea una tabella a doppia entrata ct tra df['labels'] e df['varieties'] per contare quante volte ciascuna varietà di cereale coincide con ciascuna etichetta di cluster.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Perform the necessary imports
import ____ as ____
from ____ import ____

# Use fcluster to extract labels: labels
labels = ____

# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Modifica ed esegui il codice