Pipelines erstellen
Jetzt nutzt du eines der besten Features von scikit-learn: Pipelines. Pipelines ermöglichen es dir, mehrere Schritte wie Transformationen und Schätzverfahren zu verketten, die dann nacheinander auf neue Daten angewendet werden.
Du erstellst nun eine Pipeline, die sowohl einen StandardScaler als auch einen LogisticRegression-Schätzer enthält.
So kannst du unskalierte Daten an die Pipeline übergeben: Der Scaler skaliert die Daten, und die LogisticRegression sagt die Zielspalte voraus.
Die unskalierten Daten liegen als X_train vor, die Labels wurden als y_train geladen.
Ein Teil der Daten, X_test, steht ebenfalls zur Bewertung des Modells bereit.
StandardScaler und LogisticRegression wurden bereits für dich importiert.
Diese Übung ist Teil des Kurses
IoT-Daten in Python analysieren
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import pipeline
from ____ import ____
# Create Scaler and Regression objects
sc = ____()
logreg = ____