CommencerCommencez gratuitement

Sélection de colonnes et performance du modèle

Créer l’ensemble d’entraînement à partir de différentes combinaisons de colonnes influence le modèle et les valeurs d’importance des colonnes. Une autre sélection de colonnes affecte-t-elle aussi les scores F-1, la combinaison de la precision et du recall, du modèle ? Vous pouvez répondre à cette question en entraînant deux modèles différents sur deux jeux de colonnes différents, puis en vérifiant leurs performances.

Prédire à tort des défauts comme des non-défauts peut entraîner des pertes inattendues si la probabilité de défaut de ces prêts était très faible. Vous pouvez utiliser le score F-1 pour les défauts afin de voir dans quelle mesure les modèles prédisent correctement les défauts.

Les données de crédit cr_loan_prep et les deux ensembles de colonnes d’entraînement X et X2 ont été chargés dans l’espace de travail. Les modèles gbt et gbt2 ont déjà été entraînés.

Cet exercice fait partie du cours

<cours>Modélisation du risque de crédit en Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)

# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))

# Print the classification report of the second model
print(____(____, ____, target_names=target_names))
Modifier et exécuter le code