IniziaInizia gratis

Clustering dei dati sui pesci

Ora userai la tua pipeline di standardizzazione e clustering dell'esercizio precedente per raggruppare i pesci in base alle loro misurazioni e poi creare una tabella a doppia entrata per confrontare le etichette dei cluster con le specie dei pesci.

Come prima, samples è l'array 2D delle misurazioni dei pesci. La tua pipeline è disponibile come pipeline e la specie di ogni campione di pesce è fornita dalla lista species.

Questo esercizio fa parte del corso

Apprendimento non supervisionato in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa pandas come pd.
  • Adatta la pipeline alle misurazioni dei pesci samples.
  • Ottieni le etichette di cluster per samples usando il metodo .predict() di pipeline.
  • Usando pd.DataFrame(), crea un DataFrame df con due colonne chiamate 'labels' e 'species', utilizzando rispettivamente labels e species come valori delle colonne.
  • Usando pd.crosstab(), crea una tabella a doppia entrata ct di df['labels'] e df['species'].

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Modifica ed esegui il codice