Creación de conjuntos de entrenamiento y de prueba

Acabas de entrenar modelos LogisticRegression() en diferentes columnas.

Sabes que los datos deben separarse en conjuntos de entrenamiento y de prueba. test_train_split() se utiliza para crear ambos al mismo tiempo. El conjunto de entrenamiento se utiliza para hacer predicciones, mientras que el conjunto de prueba se utiliza para la evaluación. Sin evaluar el modelo, no tienes forma de saber lo bien que funcionará con los nuevos datos del préstamo.

Además del intercept_, que es un atributo del modelo, los modelos LogisticRegression() también tienen el atributo .coef_. Esto muestra la importancia de cada columna de entrenamiento para predecir la probabilidad de impago.

El conjunto de datos cr_loan_clean ya está cargado en el espacio de trabajo.

Este ejercicio forma parte del curso

Modelado del riesgo crediticio en Python

Ver curso

Instrucciones del ejercicio

Crea el conjunto de datos X utilizando el tipo de interés, la duración del empleo y los ingresos. Crea el conjunto y utilizando el estado del préstamo.
Utiliza train_test_split() para crear los conjuntos de entrenamiento y prueba a partir de X y y.
Crea y entrena un modelo LogisticRegression() y guárdalo como clf_logistic.
Imprime los coeficientes del modelo utilizando .coef_.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Create the X and y data sets
X = ____[[____,____,____]]
y = ____[[____]]

# Use test_train_split to create the training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=.4, random_state=123)

# Create and fit the logistic regression model
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Print the models coefficients
print(____.coef_)

Editar y ejecutar código