IniziaInizia gratis

Scalare i dati sui pesci per il clustering

Ti viene fornito un array samples con le misure di pesci. Ogni riga rappresenta un singolo pesce. Le misure, come il peso in grammi, la lunghezza in centimetri e la percentuale del rapporto tra altezza e lunghezza, hanno scale molto diverse. Per raggruppare efficacemente questi dati, prima dovrai standardizzare queste feature. In questo esercizio, costruirai una pipeline per standardizzare e raggruppare i dati.

Questi dati di misurazione dei pesci provengono dal Journal of Statistics Education.

Questo esercizio fa parte del corso

Apprendimento non supervisionato in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa:
    • make_pipeline da sklearn.pipeline.
    • StandardScaler da sklearn.preprocessing.
    • KMeans da sklearn.cluster.
  • Crea un'istanza di StandardScaler chiamata scaler.
  • Crea un'istanza di KMeans con 4 cluster chiamata kmeans.
  • Crea una pipeline chiamata pipeline che colleghi scaler e kmeans. Per farlo, ti basta passarli come argomenti a make_pipeline().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____

# Create scaler: scaler
scaler = ____

# Create KMeans instance: kmeans
kmeans = ____

# Create pipeline: pipeline
pipeline = ____
Modifica ed esegui il codice