Belang van kolommen visualiseren

Als het model op verschillende sets kolommen wordt getraind, verandert de performance. Maar verandert het belang van dezelfde kolom ook, afhankelijk van de groep waarin die zit?

De gegevenssets X2 en X3 zijn aangemaakt met de volgende code:

X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]

Begrijpen hoe verschillende kolommen worden gebruikt om tot een voorspelling van loan_status te komen, is erg belangrijk voor de uitlegbaarheid van het model.

De gegevenssets cr_loan_prep, X2_train, X2_test, X3_train, X3_test, y_train, y_test zijn in de workspace geladen.

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))

# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()

Code bewerken en uitvoeren