Comparación de informes de modelos
Has utilizado modelos de regresión logística y árboles potenciados por gradiente. Es hora de comparar estos dos para ver qué modelo se utilizará para hacer las predicciones finales.
Uno de los primeros pasos más sencillos para comparar la capacidad de los distintos modelos para predecir la probabilidad de impago es observar sus métricas en classification_report(). Con esto, puedes ver muchas métricas de puntuación diferentes, una al lado de la otra, para cada modelo. Como los datos y los modelos suelen estar desequilibrados con pocos incumplimientos, céntrate por ahora en las métricas de los incumplimientos.
Los modelos entrenados clf_logistic y clf_gbt se han cargado en el espacio de trabajo junto con sus predicciones preds_df_lr y preds_df_gbt. Se utilizó un límite de 0.4 para cada uno. También está disponible el juego de pruebas y_test.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones del ejercicio
- Imprime la dirección
classification_report()para las predicciones de regresión logística. - Imprime la página
classification_report()para las predicciones del árbol de gradiente reforzado. - Imprime la
macro averagede la Puntuación F-1 para la regresión logística utilizandoprecision_recall_fscore_support(). - Imprime la
macro averagede la Puntuación F-1 para el árbol potenciado por gradiente utilizandoprecision_recall_fscore_support().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print the logistic regression classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))
# Print the gradient boosted tree classification report
print(____(____, ____['loan_status'], target_names=target_names))
# Print the default F-1 scores for the logistic regression
print(____(____,____['loan_status'], average = 'macro')[2])
# Print the default F-1 scores for the gradient boosted tree
print(____(____,____['loan_status'], average = 'macro')[2])