Régression logistique combinée avec SMOTE
Dans cet exercice, vous allez reprendre le modèle de régression logistique de l’exercice précédent et le combiner avec une méthode de rééchantillonnage SMOTE. Nous allons vous montrer comment le faire efficacement en utilisant un pipeline qui combine en une seule fois la méthode de rééchantillonnage et le modèle. Commencez par définir le pipeline que vous allez utiliser.
Cet exercice fait partie du cours
Détection de fraude en Python
Instructions
- Importez le module
Pipelinedepuisimblearn, cela a déjà été fait pour vous. - Définissez ensuite ce que vous souhaitez mettre dans le pipeline : assignez la méthode
SMOTE()àresampling, etLogisticRegression()àmodel. - Combinez ces deux étapes dans la fonction
Pipeline(). Vous devez indiquer que vous voulez combinerresamplingavecmodelà l’endroit approprié dans l’argument. Je vous montre comment procéder.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# This is the pipeline module we need for this from imblearn
from imblearn.pipeline import Pipeline
# Define which resampling method and which ML model to use in the pipeline
resampling = ____
model = ____
# Define the pipeline, tell it to combine SMOTE with the Logistic Regression model
pipeline = Pipeline([('SMOTE', resampling), ('Logistic Regression', model)])