LoslegenKostenlos loslegen

Fischdaten fürs Clustering skalieren

Du erhältst ein Array namens samples mit Messwerten von Fischen. Jede Zeile steht für einen einzelnen Fisch. Die Messungen – zum Beispiel Gewicht in Gramm, Länge in Zentimetern und das prozentuale Verhältnis von Höhe zu Länge – haben sehr unterschiedliche Skalen. Damit du diese Daten effektiv clustern kannst, musst du die Merkmale zuerst standardisieren. In dieser Übung baust du eine Pipeline, um die Daten zu standardisieren und zu clustern.

Diese Fischmessdaten stammen aus dem Journal of Statistics Education.

Diese Übung ist Teil des Kurses

Unsupervised Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere:
    • make_pipeline aus sklearn.pipeline.
    • StandardScaler aus sklearn.preprocessing.
    • KMeans aus sklearn.cluster.
  • Erstelle eine Instanz von StandardScaler namens scaler.
  • Erstelle eine Instanz von KMeans mit 4 Clustern namens kmeans.
  • Erstelle eine Pipeline namens pipeline, die scaler und kmeans verknüpft. Dazu brauchst du sie nur als Argumente an make_pipeline() zu übergeben.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____

# Create scaler: scaler
scaler = ____

# Create KMeans instance: kmeans
kmeans = ____

# Create pipeline: pipeline
pipeline = ____
Code bearbeiten und ausführen