Regresión logística multivariante
Generalmente, no utilizarás solo loan_int_rate
para predecir la probabilidad de impago. Querrás utilizar todos los datos que tengas para hacer predicciones.
Teniendo esto en cuenta, intenta entrenar un nuevo modelo con diferentes columnas, llamadas características, de los datos de cr_loan_clean
. ¿Difiere este modelo del primero? Para ello, puedes comprobar fácilmente la .intercept_
de la regresión logística. Recuerda que este es el punto de corte en «y» de la función y las probabilidades logarítmicas generales de un valor no predeterminado.
Los datos de cr_loan_clean
se han cargado en el espacio de trabajo junto con el modelo anterior clf_logistic_single
.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones de ejercicio
- Crea un nuevo conjunto de datos
X
conloan_int_rate
yperson_emp_length
. Guárdalo comoX_multi
. - Crea un conjunto de datos
y
solo conloan_status
. - Crea y
.fit()
un modeloLogisticRegression()
sobre los nuevos datosX
. Guárdalo comoclf_logistic_multi
. - Imprime el valor
.intercept_
del modelo
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create X data for the model
X_multi = ____[[____,____]]
# Create a set of y data for training
y = ____[[____]]
# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))
# Print the intercept of the model
print(____.____)