Utiliser un pipeline

Maintenant que vous avez défini votre pipeline, c’est‑à‑dire combiner une régression logistique avec une méthode SMOTE, exécutons‑le sur les données. Vous pouvez traiter le pipeline comme un seul modèle de Machine Learning. Nos données X et y sont déjà définies, et le pipeline a été créé dans l’exercice précédent. Envie de découvrir les résultats du modèle ? Essayons !

Cet exercice fait partie du cours

<cours>Détection de fraude en Python</cours>

Voir le cours

Instructions de l’exercice

Séparez les données X et y en ensembles d’entraînement et de test. Réservez 30 % des données pour l’ensemble de test et fixez random_state à zéro.
Entraînez votre pipeline sur les données d’entraînement, puis obtenez les prédictions en exécutant la fonction pipeline.predict() sur notre jeu de données X_test.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Split your data X and y, into a training and a test set and fit the pipeline onto the training data
X_train, X_test, y_train, y_test = ____

# Fit your pipeline onto your training set and obtain predictions by fitting the model onto the test data 
pipeline.fit(____, ____) 
predicted = pipeline.____(____)

# Obtain the results from the classification report and confusion matrix 
print('Classifcation report:\n', classification_report(y_test, predicted))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)

Modifier et exécuter le code