Noções básicas de regressão logística
Agora você limpou os dados e criou o novo conjunto de dados cr_loan_clean.
Pense no gráfico de dispersão final do capítulo 1, que mostrava mais inadimplências com um valor alto loan_int_rate. As taxas de juros são fáceis de entender, mas qual é a utilidade delas para prever a probabilidade de inadimplência?
Como você ainda não tentou prever a probabilidade de inadimplência, teste a criação e o treinamento de um modelo de regressão logística apenas com loan_int_rate. Verifique também os parâmetros internos do modelo, que são como configurações, para ver a estrutura do modelo com essa única coluna.
Os dados cr_loan_clean já foram carregados no espaço de trabalho.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções do exercício
- Crie os conjuntos
Xeyusando as colunasloan_int_rateeloan_status. - Crie e ajuste um modelo de regressão logística aos dados de treinamento e chame-o de
clf_logistic_single. - Imprima os parâmetros do modelo com
.get_params(). - Verifique a interceptação do modelo com o atributo
.intercept_.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the X and y data sets
X = ____[[____]]
y = ____[[____]]
# Create and fit a logistic regression model
____ = ____()
clf_logistic_single.____(X, np.ravel(____))
# Print the parameters of the model
print(____.____())
# Print the intercept of the model
print(____.____)