Noções básicas de regressão logística
Agora você limpou os dados e criou o novo conjunto de dados cr_loan_clean
.
Pense no gráfico de dispersão final do capítulo 1, que mostrava mais inadimplências com um valor alto loan_int_rate
. As taxas de juros são fáceis de entender, mas qual é a utilidade delas para prever a probabilidade de inadimplência?
Como você ainda não tentou prever a probabilidade de inadimplência, teste a criação e o treinamento de um modelo de regressão logística apenas com loan_int_rate
. Verifique também os parâmetros internos do modelo, que são como configurações, para ver a estrutura do modelo com essa única coluna.
Os dados cr_loan_clean
já foram carregados no espaço de trabalho.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções de exercício
- Crie os conjuntos
X
ey
usando as colunasloan_int_rate
eloan_status
. - Crie e ajuste um modelo de regressão logística aos dados de treinamento e chame-o de
clf_logistic_single
. - Imprima os parâmetros do modelo com
.get_params()
. - Verifique a interceptação do modelo com o atributo
.intercept_
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create the X and y data sets
X = ____[[____]]
y = ____[[____]]
# Create and fit a logistic regression model
____ = ____()
clf_logistic_single.____(X, np.ravel(____))
# Print the parameters of the model
print(____.____())
# Print the intercept of the model
print(____.____)