Visualizzare l'importanza delle colonne

Quando il modello viene addestrato su insiemi diversi di colonne cambia la performance, ma l'importanza della stessa colonna cambia a seconda del gruppo in cui si trova?

Gli insiemi di dati X2 e X3 sono stati creati con il seguente codice:

X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]

Capire come vengono usate le diverse colonne per arrivare a una previsione di loan_status è molto importante per l'interpretabilità del modello.

Gli insiemi di dati cr_loan_prep, X2_train, X2_test, X3_train, X3_test, y_train, y_test sono caricati nell'ambiente di lavoro.

Questo esercizio fa parte del corso

Credit Risk Modeling in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))

# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()

Modifica ed esegui il codice