ComenzarEmpieza gratis

Previsión de la probabilidad de impago

Todo el procesamiento de datos está completo y es hora de empezar a crear predicciones de probabilidad de impago. Quieres entrenar un modelo LogisticRegression() con los datos, y examinar cómo predice la probabilidad de impago.

Para que puedas comprender mejor lo que produce el modelo con predict_proba, debes ver un registro de ejemplo junto con la probabilidad de impago prevista. ¿Cómo se comparan las cinco primeras predicciones con los valores reales de loan_status?

El conjunto de datos cr_loan_prep junto con X_train, X_test, y_train, y y_test ya se han cargado en el espacio de trabajo.

Este ejercicio forma parte del curso

Modelado del riesgo crediticio en Python

Ver curso

Instrucciones del ejercicio

  • Entrena un modelo de regresión logística con los datos de entrenamiento y guárdalo como clf_logistic.
  • Utiliza predict_proba() en los datos de prueba para crear las predicciones y almacenarlas en preds.
  • Crea dos marcos de datos, preds_df y true_df, para almacenar las cinco primeras predicciones y los valores verdaderos de loan_status.
  • Imprime true_df y preds_df como un conjunto utilizando .concat().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))
Editar y ejecutar código