Noções básicas de regressão logística
Você já limpou os dados e criou o novo conjunto cr_loan_clean.
Lembre-se do último gráfico de dispersão do capítulo 1, que mostrou mais inadimplências com loan_int_rate alta. Taxas de juros são fáceis de entender, mas quão úteis elas são para prever a probabilidade de default?
Como você ainda não tentou prever a probabilidade de default, experimente criar e treinar um modelo de regressão logística usando apenas loan_int_rate. Também confira os parâmetros internos do modelo, que funcionam como configurações, para entender a estrutura do modelo com essa única coluna.
Os dados cr_loan_clean já foram carregados no ambiente de trabalho.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em Python
Instruções do exercício
- Crie os conjuntos
Xeyusando as colunasloan_int_rateeloan_status. - Crie e ajuste um modelo de regressão logística aos dados de treino e chame-o de
clf_logistic_single. - Imprima os parâmetros do modelo com
.get_params(). - Verifique o intercepto do modelo com o atributo
.intercept_.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the X and y data sets
X = ____[[____]]
y = ____[[____]]
# Create and fit a logistic regression model
____ = ____()
clf_logistic_single.____(X, np.ravel(____))
# Print the parameters of the model
print(____.____())
# Print the intercept of the model
print(____.____)