Rapportage voor default-classificatie
Tijd om de evaluatie van het model van dichterbij te bekijken. Hier helpt het instellen van de drempel voor de probability of default je om de modelprestaties te analyseren via classificatierapportage.
Een data frame met de waarschijnlijkheden maakt het werken ermee makkelijker, omdat je dan alle mogelijkheden van pandas kunt gebruiken. Pas de drempel toe op de data en bekijk de value counts voor beide klassen van loan_status om te zien hoeveel voorspellingen van elk type worden gemaakt. Dit geeft inzicht in de scores in het classificatierapport.
De gegevensset cr_loan_prep, de getrainde logistieke regressie clf_logistic, de echte waarden voor de leningstatus y_test en de voorspelde waarschijnlijkheden preds zijn geladen in de werkruimte.
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in Python
Oefeninstructies
- Maak een data frame met alleen de probabilities of default uit
preds, genaamdpreds_df. - Wijs
loan_status-waarden opnieuw toe op basis van een drempel van0.50voor probability of default inpreds_df. - Print de value counts van het aantal rijen voor elke
loan_status. - Print het classificatierapport met
y_testenpreds_df.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])
# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the row counts for each loan status
print(____[____].____())
# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))