ComenzarEmpieza gratis

Selección de columnas y rendimiento del modelo

Crear el conjunto de entrenamiento a partir de distintas combinaciones de columnas afecta al modelo y a los valores de importancia de las columnas. ¿Una selección diferente de columnas afecta también a las puntuaciones F-1, la combinación de las precision y recall, del modelo? Puedes responder a esta pregunta entrenando dos modelos diferentes con dos conjuntos distintos de columnas, y comprobando el rendimiento.

Predecir erróneamente los impagos como no impagos puede dar lugar a pérdidas inesperadas si la probabilidad de impago de estos préstamos era muy baja. Puedes utilizar la puntuación F-1 de los impagos para ver cómo los modelos predicen con precisión los impagos.

Los datos de crédito, cr_loan_prep y los dos conjuntos de columnas de entrenamiento X y X2 se han cargado en el espacio de trabajo. Los modelos gbt y gbt2 ya han sido entrenados.

Este ejercicio forma parte del curso

Modelado del riesgo crediticio en Python

Ver curso

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)

# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))

# Print the classification report of the second model
print(____(____, ____, target_names=target_names))
Editar y ejecutar código