Utiliser un pipeline
Maintenant que vous avez défini votre pipeline, c’est‑à‑dire combiner une régression logistique avec une méthode SMOTE, exécutons‑le sur les données. Vous pouvez traiter le pipeline comme un seul modèle de Machine Learning. Nos données X et y sont déjà définies, et le pipeline a été créé dans l’exercice précédent. Envie de découvrir les résultats du modèle ? Essayons !
Cet exercice fait partie du cours
Détection de fraude en Python
Instructions
- Séparez les données
Xetyen ensembles d’entraînement et de test. Réservez 30 % des données pour l’ensemble de test et fixezrandom_stateà zéro. - Entraînez votre pipeline sur les données d’entraînement, puis obtenez les prédictions en exécutant la fonction
pipeline.predict()sur notre jeu de donnéesX_test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Split your data X and y, into a training and a test set and fit the pipeline onto the training data
X_train, X_test, y_train, y_test = ____
# Fit your pipeline onto your training set and obtain predictions by fitting the model onto the test data
pipeline.fit(____, ____)
predicted = pipeline.____(____)
# Obtain the results from the classification report and confusion matrix
print('Classifcation report:\n', classification_report(y_test, predicted))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)