Selezione delle colonne e prestazioni del modello

Creare il set di training da diverse combinazioni di colonne influisce sul modello e sui valori di importanza delle colonne. Una selezione diversa di colonne influisce anche sugli F-1 score, la combinazione di precision e recall, del modello? Puoi rispondere a questa domanda addestrando due modelli diversi su due insiemi di colonne diversi e verificando le prestazioni.

Predire in modo errato come non-default dei prestiti che invece andranno in default può portare a perdite inattese, soprattutto se la probabilità di default per questi prestiti era molto bassa. Puoi usare l'F-1 score per i default per vedere con quanta accuratezza i modelli prevedono i default.

I dati di credito, cr_loan_prep, e i due insiemi di colonne di training X e X2 sono stati caricati nell’ambiente di lavoro. I modelli gbt e gbt2 sono già stati addestrati.

Questo esercizio fa parte del corso

Credit Risk Modeling in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)

# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))

# Print the classification report of the second model
print(____(____, ____, target_names=target_names))

Modifica ed esegui il codice