Créer des pipelines

Vous allez maintenant utiliser l’une des meilleures fonctionnalités offertes par scikit-learn : les Pipelines. Les Pipelines vous permettent d’enchaîner plusieurs étapes, comme des transformations et des estimations, appliquées séquentiellement à de nouvelles données.

Vous allez créer un pipeline contenant à la fois un StandardScaler et un estimateur LogisticRegression.

Cela vous permet de fournir des données non normalisées au pipeline : le Scaler mettra les données à l’échelle, puis la LogisticRegression prédira la colonne cible.

Les données non mises à l’échelle sont disponibles dans X_train, et les étiquettes ont été chargées dans y_train. Un sous-ensemble des données, X_test, est également disponible pour évaluer le modèle.

StandardScaler et LogisticRegression ont été importés pour vous.

Cet exercice fait partie du cours

<cours>Analyzing IoT Data in Python</cours>

Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import pipeline
from ____ import ____

# Create Scaler and Regression objects
sc = ____()
logreg = ____

Modifier et exécuter le code