Criando conjuntos de treino e teste
Você acabou de treinar modelos LogisticRegression() com diferentes colunas.
Você sabe que os dados devem ser separados em conjuntos de treino e teste. test_train_split() é usado para criar ambos ao mesmo tempo. O conjunto de treino é usado para fazer previsões, enquanto o conjunto de teste é usado para avaliação. Sem avaliar o modelo, você não tem como saber o quão bem ele vai performar em novos dados de empréstimo.
Além do intercept_, que é um atributo do modelo, modelos LogisticRegression() também têm o atributo .coef_. Isso mostra a importância de cada coluna de treino para prever a probabilidade de inadimplência.
O conjunto de dados cr_loan_clean já está carregado no workspace.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em Python
Instruções do exercício
- Crie o conjunto de dados
Xusando taxa de juros, tempo de emprego e renda. Crie o conjuntoyusando o status do empréstimo. - Use
train_test_split()para criar os conjuntos de treino e teste a partir deXey. - Crie e treine um modelo
LogisticRegression()e armazene-o comoclf_logistic. - Imprima os coeficientes do modelo usando
.coef_.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the X and y data sets
X = ____[[____,____,____]]
y = ____[[____]]
# Use test_train_split to create the training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=.4, random_state=123)
# Create and fit the logistic regression model
____ = ____(solver='lbfgs').____(____, np.ravel(____))
# Print the models coefficients
print(____.coef_)