Utiliser différents ensembles de variables
Ajouter des variables, et donc de la complexité, à votre modèle de régression logistique ne conduit pas automatiquement à un modèle plus précis. Dans cet exercice, vous allez vérifier si l’ajout de 3 variables à un modèle le rend plus performant.
variables_1 et variables_2 sont disponibles dans votre environnement : vous pouvez les afficher dans la console pour voir à quoi elles ressemblent.
Cet exercice fait partie du cours
Introduction à l’analytique prédictive en Python
Instructions
- Ajustez le modèle
logregen utilisantvariables_2, qui contient 3 variables supplémentaires par rapport àvariables_1. - Faites des prédictions pour ce modèle.
- Calculez l’AUC de ce modèle.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create appropriate DataFrames
X_1 = basetable[variables_1]
X_2 = basetable[variables_2]
y = basetable[["target"]]
# Create the logistic regression model
logreg = linear_model.LogisticRegression()
# Make predictions using the first set of variables and assign the AUC to auc_1
logreg.fit(X_1, y)
predictions_1 = logreg.predict_proba(X_1)[:,1]
auc_1 = roc_auc_score(y, predictions_1)
# Make predictions using the second set of variables and assign the AUC to auc_2
logreg.____(____, ____)
predictions_2 = ____.____(____)[____,____]
auc_2 = ____(____, ____)
# Print auc_1 and auc_2
print(round(auc_1,2))
print(round(auc_2,2))