Criando conjuntos de treino e teste

Você acabou de treinar modelos LogisticRegression() com diferentes colunas.

Você sabe que os dados devem ser separados em conjuntos de treino e teste. test_train_split() é usado para criar ambos ao mesmo tempo. O conjunto de treino é usado para fazer previsões, enquanto o conjunto de teste é usado para avaliação. Sem avaliar o modelo, você não tem como saber o quão bem ele vai performar em novos dados de empréstimo.

Além do intercept_, que é um atributo do modelo, modelos LogisticRegression() também têm o atributo .coef_. Isso mostra a importância de cada coluna de treino para prever a probabilidade de inadimplência.

O conjunto de dados cr_loan_clean já está carregado no workspace.

Este exercicio faz parte do curso

Modelagem de Risco de Crédito em Python

Ver curso

Instruções do exercicio

Crie o conjunto de dados X usando taxa de juros, tempo de emprego e renda. Crie o conjunto y usando o status do empréstimo.
Use train_test_split() para criar os conjuntos de treino e teste a partir de X e y.
Crie e treine um modelo LogisticRegression() e armazene-o como clf_logistic.
Imprima os coeficientes do modelo usando .coef_.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create the X and y data sets
X = ____[[____,____,____]]
y = ____[[____]]

# Use test_train_split to create the training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=.4, random_state=123)

# Create and fit the logistic regression model
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Print the models coefficients
print(____.coef_)

Editar e Executar Código