Sélection de colonnes et performance du modèle
Créer l’ensemble d’entraînement à partir de différentes combinaisons de colonnes influence le modèle et les valeurs d’importance des colonnes. Une autre sélection de colonnes affecte-t-elle aussi les scores F-1, la combinaison de la precision et du recall, du modèle ? Vous pouvez répondre à cette question en entraînant deux modèles différents sur deux jeux de colonnes différents, puis en vérifiant leurs performances.
Prédire à tort des défauts comme des non-défauts peut entraîner des pertes inattendues si la probabilité de défaut de ces prêts était très faible. Vous pouvez utiliser le score F-1 pour les défauts afin de voir dans quelle mesure les modèles prédisent correctement les défauts.
Les données de crédit cr_loan_prep et les deux ensembles de colonnes d’entraînement X et X2 ont été chargés dans l’espace de travail. Les modèles gbt et gbt2 ont déjà été entraînés.
Cet exercice fait partie du cours
<cours>Modélisation du risque de crédit en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)
# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))
# Print the classification report of the second model
print(____(____, ____, target_names=target_names))