CommencerCommencer gratuitement

Utiliser différents ensembles de variables

Ajouter des variables, et donc de la complexité, à votre modèle de régression logistique ne conduit pas automatiquement à un modèle plus précis. Dans cet exercice, vous allez vérifier si l’ajout de 3 variables à un modèle le rend plus performant.

variables_1 et variables_2 sont disponibles dans votre environnement : vous pouvez les afficher dans la console pour voir à quoi elles ressemblent.

Cet exercice fait partie du cours

Introduction à l’analytique prédictive en Python

Afficher le cours

Instructions

  • Ajustez le modèle logreg en utilisant variables_2, qui contient 3 variables supplémentaires par rapport à variables_1.
  • Faites des prédictions pour ce modèle.
  • Calculez l’AUC de ce modèle.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create appropriate DataFrames
X_1 = basetable[variables_1]
X_2 = basetable[variables_2]
y = basetable[["target"]]

# Create the logistic regression model
logreg = linear_model.LogisticRegression()

# Make predictions using the first set of variables and assign the AUC to auc_1
logreg.fit(X_1, y)
predictions_1 = logreg.predict_proba(X_1)[:,1]
auc_1 = roc_auc_score(y, predictions_1)

# Make predictions using the second set of variables and assign the AUC to auc_2
logreg.____(____, ____)
predictions_2 = ____.____(____)[____,____]
auc_2 = ____(____, ____)

# Print auc_1 and auc_2
print(round(auc_1,2))
print(round(auc_2,2))
Modifier et exécuter le code