CommencerCommencer gratuitement

Ajuster une régression logistique avec régularisation L1

Vous allez exécuter un modèle de régression logistique sur des données mises à l’échelle avec une régularisation L1 afin d’effectuer une sélection de variables en même temps que la construction du modèle. Dans la vidéo, vous avez vu comment différentes valeurs de C influencent votre score de précision et le nombre de variables non nulles. Dans cet exercice, vous fixerez la valeur de C à 0,025.

Les fonctions LogisticRegression et accuracy_score de la bibliothèque sklearn ont été chargées pour vous. De plus, les variables explicatives mises à l’échelle et la variable cible ont été chargées sous forme de train_X, train_Y pour les données d’entraînement, et test_X, test_Y pour les données de test.

Cet exercice fait partie du cours

Machine Learning pour le marketing en Python

Afficher le cours

Instructions

  • Initialisez une régression logistique avec une régularisation L1 et une valeur de C égale à 0,025.
  • Entraînez le modèle sur les données d’entraînement.
  • Prédisez la churn sur les données de test.
  • Affichez le score de précision de vos étiquettes prédites sur les données de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initialize logistic regression instance 
logreg = ___(penalty='l1', ___=0.025, solver='liblinear')

# Fit the model on training data
logreg.___(train_X, ___)

# Predict churn values on test data
pred_test_Y = logreg.predict(___)

# Print the accuracy score on test data
print('Test accuracy:', round(accuracy_score(test_Y, ___), 4))
Modifier et exécuter le code