Selección de columnas y rendimiento del modelo
Crear el conjunto de entrenamiento a partir de distintas combinaciones de columnas afecta al modelo y a los valores de importancia de las columnas. ¿Una selección diferente de columnas afecta también a las puntuaciones F-1, la combinación de las precision
y recall
, del modelo? Puedes responder a esta pregunta entrenando dos modelos diferentes con dos conjuntos distintos de columnas, y comprobando el rendimiento.
Predecir erróneamente los impagos como no impagos puede dar lugar a pérdidas inesperadas si la probabilidad de impago de estos préstamos era muy baja. Puedes utilizar la puntuación F-1 de los impagos para ver cómo los modelos predicen con precisión los impagos.
Los datos de crédito, cr_loan_prep
y los dos conjuntos de columnas de entrenamiento X
y X2
se han cargado en el espacio de trabajo. Los modelos gbt
y gbt2
ya han sido entrenados.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)
# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))
# Print the classification report of the second model
print(____(____, ____, target_names=target_names))