Scalare i dati sui pesci per il clustering
Ti viene fornito un array samples con le misure di pesci. Ogni riga rappresenta un singolo pesce. Le misure, come il peso in grammi, la lunghezza in centimetri e la percentuale del rapporto tra altezza e lunghezza, hanno scale molto diverse. Per raggruppare efficacemente questi dati, prima dovrai standardizzare queste feature. In questo esercizio, costruirai una pipeline per standardizzare e raggruppare i dati.
Questi dati di misurazione dei pesci provengono dal Journal of Statistics Education.
Questo esercizio fa parte del corso
Apprendimento non supervisionato in Python
Istruzioni dell'esercizio
- Importa:
make_pipelinedasklearn.pipeline.StandardScalerdasklearn.preprocessing.KMeansdasklearn.cluster.
- Crea un'istanza di
StandardScalerchiamatascaler. - Crea un'istanza di
KMeanscon4cluster chiamatakmeans. - Crea una pipeline chiamata
pipelineche colleghiscalerekmeans. Per farlo, ti basta passarli come argomenti amake_pipeline().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____
# Create scaler: scaler
scaler = ____
# Create KMeans instance: kmeans
kmeans = ____
# Create pipeline: pipeline
pipeline = ____