Sélection de colonnes et performance du modèle
Créer l’ensemble d’entraînement à partir de différentes combinaisons de colonnes influence le modèle et les valeurs d’importance des colonnes. Une autre sélection de colonnes affecte-t-elle aussi les scores F-1, la combinaison de la precision et du recall, du modèle ? Vous pouvez répondre à cette question en entraînant deux modèles différents sur deux jeux de colonnes différents, puis en vérifiant leurs performances.
Prédire à tort des défauts comme des non-défauts peut entraîner des pertes inattendues si la probabilité de défaut de ces prêts était très faible. Vous pouvez utiliser le score F-1 pour les défauts afin de voir dans quelle mesure les modèles prédisent correctement les défauts.
Les données de crédit cr_loan_prep et les deux ensembles de colonnes d’entraînement X et X2 ont été chargés dans l’espace de travail. Les modèles gbt et gbt2 ont déjà été entraînés.
Cet exercice fait partie du cours
Modélisation du risque de crédit en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)
# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))
# Print the classification report of the second model
print(____(____, ____, target_names=target_names))