Inizia subitoInizia gratis

Estrarre le etichette dei cluster

Nell'esercizio precedente, hai visto che il clustering intermedio dei campioni di cereali all'altezza 6 ha 3 cluster. Ora, usa la funzione fcluster() per estrarre le etichette dei cluster per questo clustering intermedio e confronta le etichette con le varietà di cereali usando una tabella a doppia entrata.

Il clustering gerarchico è già stato eseguito e mergings è il risultato della funzione linkage(). La lista varieties indica la varietà di ciascun campione di cereale.

Questo esercizio fa parte del corso

Apprendimento non supervisionato in Python

Visualizza corso

Istruzioni dell'esercizio

  • Importa:
    • pandas come pd.
    • fcluster da scipy.cluster.hierarchy.
  • Esegui un clustering gerarchico piatto usando la funzione fcluster() su mergings. Specifica un'altezza massima di 6 e l'argomento criterion='distance'.
  • Crea un DataFrame df con due colonne chiamate 'labels' e 'varieties', usando rispettivamente labels e varieties come valori delle colonne. Questo è già stato fatto per te.
  • Crea una tabella a doppia entrata ct tra df['labels'] e df['varieties'] per contare quante volte ciascuna varietà di cereale coincide con ciascuna etichetta di cluster.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Perform the necessary imports
import ____ as ____
from ____ import ____

# Use fcluster to extract labels: labels
labels = ____

# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Modifica ed esegui il codice