Criação de conjuntos de treinamento e teste
Você acabou de treinar modelos LogisticRegression()
em colunas diferentes.
Você sabe que os dados devem ser separados em conjuntos de treinamento e de teste. O site test_train_split()
é usado para criar ambos ao mesmo tempo. O conjunto de treinamento é usado para fazer previsões, enquanto o conjunto de teste é usado para avaliação. Sem avaliar o modelo, você não tem como saber qual será o desempenho dele com novos dados de empréstimo.
Além do intercept_
, que é um atributo do modelo, os modelos LogisticRegression()
também têm o atributo .coef_
. Isso mostra a importância de cada coluna de treinamento para prever a probabilidade de inadimplência.
O conjunto de dados cr_loan_clean
já está carregado no espaço de trabalho.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções de exercício
- Crie o conjunto de dados
X
usando taxa de juros, duração do emprego e renda. Crie o conjuntoy
usando o status do empréstimo. - Use
train_test_split()
para criar os conjuntos de treinamento e teste a partir deX
ey
. - Crie e treine um modelo
LogisticRegression()
e armazene-o comoclf_logistic
. - Imprima os coeficientes do modelo usando
.coef_
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create the X and y data sets
X = ____[[____,____,____]]
y = ____[[____]]
# Use test_train_split to create the training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=.4, random_state=123)
# Create and fit the logistic regression model
____ = ____(solver='lbfgs').____(____, np.ravel(____))
# Print the models coefficients
print(____.coef_)