Notions de base de la régression logistique

Vous avez maintenant nettoyé les données et créé le nouveau jeu de données cr_loan_clean.

Repensez au nuage de points final du chapitre 1, qui montrait davantage de défauts lorsque loan_int_rate est élevée. Les taux d'intérêt sont faciles à comprendre, mais dans quelle mesure sont-ils utiles pour prévoir la probabilité de défaut ?

Comme vous n'avez pas encore essayé de prédire la probabilité de défaut, testez la création et l'entraînement d'un modèle de régression logistique avec uniquement loan_int_rate. Consultez aussi les paramètres internes du modèle, qui correspondent à des réglages, pour voir la structure du modèle avec cette seule colonne.

Les données cr_loan_clean ont déjà été chargées dans l'espace de travail.

Cet exercice fait partie du cours

<cours>Modélisation du risque de crédit en Python</cours>

Voir le cours

Instructions de l’exercice

Créez les ensembles X et y à partir des colonnes loan_int_rate et loan_status.
Créez et ajustez un modèle de régression logistique sur les données d'entraînement et nommez-le clf_logistic_single.
Affichez les paramètres du modèle avec .get_params().
Vérifiez l'ordonnée à l'origine (intercept) du modèle avec l'attribut .intercept_.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create the X and y data sets
X = ____[[____]]
y = ____[[____]]

# Create and fit a logistic regression model
____ = ____()
clf_logistic_single.____(X, np.ravel(____))

# Print the parameters of the model
print(____.____())

# Print the intercept of the model
print(____.____)

Modifier et exécuter le code