Visualización de la importancia de la columna
Cuando el modelo se entrena en diferentes grupos de columnas, cambia el rendimiento, pero ¿cambia la importancia de la misma columna dependiendo del grupo en el que se encuentre?
Los conjuntos de datos X2
y X3
se han creado con el siguiente código:
X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]
Comprender cómo se utilizan las distintas columnas para llegar a una predicción loan_status
es muy importante para la interpretabilidad del modelo.
Los conjuntos de datos cr_loan_prep
, X2_train
, X2_test
, X3_train
, X3_test
, y_train
, y_test
se cargan en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))
# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()