Importancia de la columna y previsión de impago
Cuando se utilizan varios conjuntos de entrenamiento con muchos grupos diferentes de columnas, es importante vigilar qué columnas importan y cuáles no. Puede resultar caro o llevar mucho tiempo mantener un conjunto de columnas aunque no tengan ninguna repercusión en loan_status.
Los datos de X para este ejercicio se crearon con el siguiente código:
X = cr_loan_prep[['person_income','loan_int_rate',
'loan_percent_income','loan_amnt',
'person_home_ownership_MORTGAGE','loan_grade_F']]
Entrena un modelo XGBClassifier() con estos datos, y comprueba la importancia de las columnas para ver cómo funciona cada una para predecir loan_status.
El conjunto de datos cr_loan_pret junto con X_train e y_train se han cargado en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones del ejercicio
- Crea y entrena un modelo
XGBClassifier()en los conjuntos de entrenamientoX_trainey_train, y guárdalo comoclf_gbt. - Imprime las importancias de las columnas de
clf_gbtutilizando.get_booster()y.get_score().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create and train the model on the training data
____ = xgb.____().____(____,np.ravel(____))
# Print the column importances from the model
print(clf_gbt.____().____(importance_type = 'weight'))