Importancia de la columna y previsión de impago
Cuando se utilizan varios conjuntos de entrenamiento con muchos grupos diferentes de columnas, es importante vigilar qué columnas importan y cuáles no. Puede resultar caro o llevar mucho tiempo mantener un conjunto de columnas aunque no tengan ninguna repercusión en loan_status
.
Los datos de X
para este ejercicio se crearon con el siguiente código:
X = cr_loan_prep[['person_income','loan_int_rate',
'loan_percent_income','loan_amnt',
'person_home_ownership_MORTGAGE','loan_grade_F']]
Entrena un modelo XGBClassifier()
con estos datos, y comprueba la importancia de las columnas para ver cómo funciona cada una para predecir loan_status
.
El conjunto de datos cr_loan_pret
junto con X_train
e y_train
se han cargado en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones de ejercicio
- Crea y entrena un modelo
XGBClassifier()
en los conjuntos de entrenamientoX_train
ey_train
, y guárdalo comoclf_gbt
. - Imprime las importancias de las columnas de
clf_gbt
utilizando.get_booster()
y.get_score()
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create and train the model on the training data
____ = xgb.____().____(____,np.ravel(____))
# Print the column importances from the model
print(clf_gbt.____().____(importance_type = 'weight'))