Ajuster une régression logistique avec régularisation L1

Vous allez exécuter un modèle de régression logistique sur des données mises à l’échelle avec une régularisation L1 afin d’effectuer une sélection de variables en même temps que la construction du modèle. Dans la vidéo, vous avez vu comment différentes valeurs de C influencent votre score de précision et le nombre de variables non nulles. Dans cet exercice, vous fixerez la valeur de C à 0,025.

Les fonctions LogisticRegression et accuracy_score de la bibliothèque sklearn ont été chargées pour vous. De plus, les variables explicatives mises à l’échelle et la variable cible ont été chargées sous forme de train_X, train_Y pour les données d’entraînement, et test_X, test_Y pour les données de test.

Cet exercice fait partie du cours

<cours>Machine Learning pour le marketing en Python</cours>

Voir le cours

Instructions de l’exercice

Initialisez une régression logistique avec une régularisation L1 et une valeur de C égale à 0,025.
Entraînez le modèle sur les données d’entraînement.
Prédisez la churn sur les données de test.
Affichez le score de précision de vos étiquettes prédites sur les données de test.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Initialize logistic regression instance 
logreg = ___(penalty='l1', ___=0.025, solver='liblinear')

# Fit the model on training data
logreg.___(train_X, ___)

# Predict churn values on test data
pred_test_Y = logreg.predict(___)

# Print the accuracy score on test data
print('Test accuracy:', round(accuracy_score(test_Y, ___), 4))

Modifier et exécuter le code