Visualizzare l'importanza delle colonne
Quando il modello viene addestrato su insiemi diversi di colonne cambia la performance, ma l'importanza della stessa colonna cambia a seconda del gruppo in cui si trova?
Gli insiemi di dati X2 e X3 sono stati creati con il seguente codice:
X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]
Capire come vengono usate le diverse colonne per arrivare a una previsione di loan_status è molto importante per l'interpretabilità del modello.
Gli insiemi di dati cr_loan_prep, X2_train, X2_test, X3_train, X3_test, y_train, y_test sono caricati nell'ambiente di lavoro.
Questo esercizio fa parte del corso
Credit Risk Modeling in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))
# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()