Fischdaten fürs Clustering skalieren
Du erhältst ein Array namens samples mit Messwerten von Fischen. Jede Zeile steht für einen einzelnen Fisch. Die Messungen – zum Beispiel Gewicht in Gramm, Länge in Zentimetern und das prozentuale Verhältnis von Höhe zu Länge – haben sehr unterschiedliche Skalen. Damit du diese Daten effektiv clustern kannst, musst du die Merkmale zuerst standardisieren. In dieser Übung baust du eine Pipeline, um die Daten zu standardisieren und zu clustern.
Diese Fischmessdaten stammen aus dem Journal of Statistics Education.
Diese Übung ist Teil des Kurses
Unsupervised Learning in Python
Anleitung zur Übung
- Importiere:
make_pipelineaussklearn.pipeline.StandardScaleraussklearn.preprocessing.KMeansaussklearn.cluster.
- Erstelle eine Instanz von
StandardScalernamensscaler. - Erstelle eine Instanz von
KMeansmit4Clustern namenskmeans. - Erstelle eine Pipeline namens
pipeline, diescalerundkmeansverknüpft. Dazu brauchst du sie nur als Argumente anmake_pipeline()zu übergeben.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____
# Create scaler: scaler
scaler = ____
# Create KMeans instance: kmeans
kmeans = ____
# Create pipeline: pipeline
pipeline = ____