Créer des pipelines
Vous allez maintenant utiliser l’une des meilleures fonctionnalités offertes par scikit-learn : les Pipelines. Les Pipelines vous permettent d’enchaîner plusieurs étapes, comme des transformations et des estimations, appliquées séquentiellement à de nouvelles données.
Vous allez créer un pipeline contenant à la fois un StandardScaler et un estimateur LogisticRegression.
Cela vous permet de fournir des données non normalisées au pipeline : le Scaler mettra les données à l’échelle, puis la LogisticRegression prédira la colonne cible.
Les données non mises à l’échelle sont disponibles dans X_train, et les étiquettes ont été chargées dans y_train.
Un sous-ensemble des données, X_test, est également disponible pour évaluer le modèle.
StandardScaler et LogisticRegression ont été importés pour vous.
Cet exercice fait partie du cours
Analyzing IoT Data in Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import pipeline
from ____ import ____
# Create Scaler and Regression objects
sc = ____()
logreg = ____