Notions de base de la régression logistique
Vous avez maintenant nettoyé les données et créé le nouveau jeu de données cr_loan_clean.
Repensez au nuage de points final du chapitre 1, qui montrait davantage de défauts lorsque loan_int_rate est élevée. Les taux d'intérêt sont faciles à comprendre, mais dans quelle mesure sont-ils utiles pour prévoir la probabilité de défaut ?
Comme vous n'avez pas encore essayé de prédire la probabilité de défaut, testez la création et l'entraînement d'un modèle de régression logistique avec uniquement loan_int_rate. Consultez aussi les paramètres internes du modèle, qui correspondent à des réglages, pour voir la structure du modèle avec cette seule colonne.
Les données cr_loan_clean ont déjà été chargées dans l'espace de travail.
Cet exercice fait partie du cours
Modélisation du risque de crédit en Python
Instructions
- Créez les ensembles
Xetyà partir des colonnesloan_int_rateetloan_status. - Créez et ajustez un modèle de régression logistique sur les données d'entraînement et nommez-le
clf_logistic_single. - Affichez les paramètres du modèle avec
.get_params(). - Vérifiez l'ordonnée à l'origine (intercept) du modèle avec l'attribut
.intercept_.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the X and y data sets
X = ____[[____]]
y = ____[[____]]
# Create and fit a logistic regression model
____ = ____()
clf_logistic_single.____(X, np.ravel(____))
# Print the parameters of the model
print(____.____())
# Print the intercept of the model
print(____.____)