Regressão logística multivariada
Em geral, você não usará apenas o site loan_int_rate
para prever a probabilidade de inadimplência. Você deverá usar todos os dados que tiver para fazer previsões.
Com isso em mente, tente treinar um novo modelo com colunas diferentes, chamadas de recursos, dos dados do site cr_loan_clean
. Esse modelo será diferente do primeiro? Para isso, você pode verificar facilmente o .intercept_
da regressão logística. Lembre-se de que essa é a interceptação y da função e as probabilidades logarítmicas gerais de não inadimplência.
Os dados do cr_loan_clean
foram carregados no espaço de trabalho junto com o modelo anterior clf_logistic_single
.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções de exercício
- Crie um novo conjunto de dados
X
comloan_int_rate
eperson_emp_length
. Armazene-o comoX_multi
. - Crie um conjunto de dados
y
com apenasloan_status
. - Crie e
.fit()
um modeloLogisticRegression()
nos novos dadosX
. Armazene-o comoclf_logistic_multi
. - Imprima o valor
.intercept_
do modelo
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create X data for the model
X_multi = ____[[____,____]]
# Create a set of y data for training
y = ____[[____]]
# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))
# Print the intercept of the model
print(____.____)