Ajuster une régression logistique avec régularisation L1
Vous allez exécuter un modèle de régression logistique sur des données mises à l’échelle avec une régularisation L1 afin d’effectuer une sélection de variables en même temps que la construction du modèle. Dans la vidéo, vous avez vu comment différentes valeurs de C influencent votre score de précision et le nombre de variables non nulles. Dans cet exercice, vous fixerez la valeur de C à 0,025.
Les fonctions LogisticRegression et accuracy_score de la bibliothèque sklearn ont été chargées pour vous. De plus, les variables explicatives mises à l’échelle et la variable cible ont été chargées sous forme de train_X, train_Y pour les données d’entraînement, et test_X, test_Y pour les données de test.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Initialisez une régression logistique avec une régularisation L1 et une valeur de
Cégale à 0,025. - Entraînez le modèle sur les données d’entraînement.
- Prédisez la churn sur les données de test.
- Affichez le score de précision de vos étiquettes prédites sur les données de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Initialize logistic regression instance
logreg = ___(penalty='l1', ___=0.025, solver='liblinear')
# Fit the model on training data
logreg.___(train_X, ___)
# Predict churn values on test data
pred_test_Y = logreg.predict(___)
# Print the accuracy score on test data
print('Test accuracy:', round(accuracy_score(test_Y, ___), 4))