Kolomselectie en modelprestaties

Het maken van de trainingsset met verschillende combinaties van kolommen beïnvloedt het model en de belangscores van de kolommen. Heeft een andere selectie van kolommen ook invloed op de F1-scores, de combinatie van precision en recall, van het model? Je kunt deze vraag beantwoorden door twee verschillende modellen te trainen op twee verschillende sets kolommen en de prestaties te vergelijken.

Onterecht defaults als non-default voorspellen kan tot onverwachte verliezen leiden als de kans op default voor deze leningen erg laag was. Je kunt de F1-score voor defaults gebruiken om te zien hoe goed de modellen de defaults correct voorspellen.

De kredietgegevens cr_loan_prep en de twee trainingskolommensets X en X2 zijn in de werkruimte geladen. De modellen gbt en gbt2 zijn al getraind.

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)

# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))

# Print the classification report of the second model
print(____(____, ____, target_names=target_names))

Code bewerken en uitvoeren