Regressão logística multivariada
Geralmente, você não vai usar apenas loan_int_rate para prever a probabilidade de inadimplência. Você vai querer usar todos os dados disponíveis para fazer previsões.
Com isso em mente, tente treinar um novo modelo com diferentes colunas, chamadas de variáveis (features), do conjunto cr_loan_clean. Este modelo será diferente do primeiro? Para isso, você pode verificar facilmente o .intercept_ da regressão logística. Lembre-se de que esse é o intercepto em y da função e representa o log-odds geral de não inadimplência.
Os dados cr_loan_clean foram carregados no workspace junto com o modelo anterior clf_logistic_single.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em Python
Instruções do exercício
- Crie um novo conjunto de dados
Xcomloan_int_rateeperson_emp_length. Armazene-o comoX_multi. - Crie um conjunto de dados
ycontendo apenasloan_status. - Crie e chame
.fit()em um modeloLogisticRegression()com os novos dadosX. Armazene-o comoclf_logistic_multi. - Imprima o valor de
.intercept_do modelo
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create X data for the model
X_multi = ____[[____,____]]
# Create a set of y data for training
y = ____[[____]]
# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))
# Print the intercept of the model
print(____.____)