Aan de slagGa gratis aan de slag

Vissengegevens schalen voor clustering

Je krijgt een array samples met metingen van vissen. Elke rij stelt een individuele vis voor. De metingen, zoals gewicht in gram, lengte in centimeter en de procentuele verhouding van hoogte tot lengte, hebben heel verschillende schalen. Om deze data effectief te clusteren, moet je deze features eerst standaardiseren. In deze oefening bouw je een pipeline om de data te standaardiseren en te clusteren.

Deze vismetingen zijn afkomstig uit de Journal of Statistics Education.

Deze oefening maakt deel uit van de cursus

Unsupervised Learning in Python

Cursus bekijken

Oefeninstructies

  • Importeer:
    • make_pipeline uit sklearn.pipeline.
    • StandardScaler uit sklearn.preprocessing.
    • KMeans uit sklearn.cluster.
  • Maak een instantie van StandardScaler met de naam scaler.
  • Maak een instantie van KMeans met 4 clusters met de naam kmeans.
  • Maak een pipeline met de naam pipeline die scaler en kmeans aan elkaar koppelt. Dit doe je door ze als argumenten door te geven aan make_pipeline().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____

# Create scaler: scaler
scaler = ____

# Create KMeans instance: kmeans
kmeans = ____

# Create pipeline: pipeline
pipeline = ____
Code bewerken en uitvoeren