Ajuster un modèle de régression logistique
La régression logistique est un modèle de classification simple mais très puissant, utilisé dans de nombreux cas d’usage. Vous allez maintenant entraîner une régression logistique sur la partie entraînement du jeu de données de churn télécom, puis prédire les étiquettes sur l’ensemble de test non vu. Ensuite, vous calculerez la précision des prédictions de votre modèle.
La fonction accuracy_score a été importée, et une instance de LogisticRegression de sklearn a été initialisée sous le nom logreg. Les jeux de données d’entraînement et de test que vous avez construits précédemment ont été chargés dans train_X et test_X pour les variables de caractéristiques, et dans train_Y et test_Y pour la variable cible.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Entraînez une régression logistique sur les données d’entraînement.
- Prédisez les étiquettes de churn pour les données de test.
- Calculez le score de précision sur les données de test.
- Affichez la précision sur le test, arrondie à 4 décimales.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit logistic regression on training data
logreg.___(train_X, train_Y)
# Predict churn labels on testing data
pred_test_Y = ___.predict(test_X)
# Calculate accuracy score on testing data
test_accuracy = ___(test_Y, pred_test_Y)
# Print test accuracy score rounded to 4 decimals
print('Test accuracy:', ___(test_accuracy, 4))