CommencerCommencer gratuitement

Régression logistique combinée avec SMOTE

Dans cet exercice, vous allez reprendre le modèle de régression logistique de l’exercice précédent et le combiner avec une méthode de rééchantillonnage SMOTE. Nous allons vous montrer comment le faire efficacement en utilisant un pipeline qui combine en une seule fois la méthode de rééchantillonnage et le modèle. Commencez par définir le pipeline que vous allez utiliser.

Cet exercice fait partie du cours

Détection de fraude en Python

Afficher le cours

Instructions

  • Importez le module Pipeline depuis imblearn, cela a déjà été fait pour vous.
  • Définissez ensuite ce que vous souhaitez mettre dans le pipeline : assignez la méthode SMOTE() à resampling, et LogisticRegression() à model.
  • Combinez ces deux étapes dans la fonction Pipeline(). Vous devez indiquer que vous voulez combiner resampling avec model à l’endroit approprié dans l’argument. Je vous montre comment procéder.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# This is the pipeline module we need for this from imblearn
from imblearn.pipeline import Pipeline 

# Define which resampling method and which ML model to use in the pipeline
resampling = ____
model = ____

# Define the pipeline, tell it to combine SMOTE with the Logistic Regression model
pipeline = Pipeline([('SMOTE', resampling), ('Logistic Regression', model)])
Modifier et exécuter le code