Rapportage voor default-classificatie

Tijd om de evaluatie van het model van dichterbij te bekijken. Hier helpt het instellen van de drempel voor de probability of default je om de modelprestaties te analyseren via classificatierapportage.

Een data frame met de waarschijnlijkheden maakt het werken ermee makkelijker, omdat je dan alle mogelijkheden van pandas kunt gebruiken. Pas de drempel toe op de data en bekijk de value counts voor beide klassen van loan_status om te zien hoeveel voorspellingen van elk type worden gemaakt. Dit geeft inzicht in de scores in het classificatierapport.

De gegevensset cr_loan_prep, de getrainde logistieke regressie clf_logistic, de echte waarden voor de leningstatus y_test en de voorspelde waarschijnlijkheden preds zijn geladen in de werkruimte.

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in Python

Bekijk cursus

Oefeninstructies

Maak een data frame met alleen de probabilities of default uit preds, genaamd preds_df.
Wijs loan_status-waarden opnieuw toe op basis van een drempel van 0.50 voor probability of default in preds_df.
Print de value counts van het aantal rijen voor elke loan_status.
Print het classificatierapport met y_test en preds_df.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])

# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)

# Print the row counts for each loan status
print(____[____].____())

# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))

Code bewerken en uitvoeren