Clustering dei dati sui pesci
Ora userai la tua pipeline di standardizzazione e clustering dell'esercizio precedente per raggruppare i pesci in base alle loro misurazioni e poi creare una tabella a doppia entrata per confrontare le etichette dei cluster con le specie dei pesci.
Come prima, samples è l'array 2D delle misurazioni dei pesci. La tua pipeline è disponibile come pipeline e la specie di ogni campione di pesce è fornita dalla lista species.
Questo esercizio fa parte del corso
Apprendimento non supervisionato in Python
Istruzioni dell'esercizio
- Importa
pandascomepd. - Adatta la pipeline alle misurazioni dei pesci
samples. - Ottieni le etichette di cluster per
samplesusando il metodo.predict()dipipeline. - Usando
pd.DataFrame(), crea un DataFramedfcon due colonne chiamate'labels'e'species', utilizzando rispettivamentelabelsespeciescome valori delle colonne. - Usando
pd.crosstab(), crea una tabella a doppia entratactdidf['labels']edf['species'].
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)