Regressão logística multivariada

Geralmente, você não vai usar apenas loan_int_rate para prever a probabilidade de inadimplência. Você vai querer usar todos os dados disponíveis para fazer previsões.

Com isso em mente, tente treinar um novo modelo com diferentes colunas, chamadas de variáveis (features), do conjunto cr_loan_clean. Este modelo será diferente do primeiro? Para isso, você pode verificar facilmente o .intercept_ da regressão logística. Lembre-se de que esse é o intercepto em y da função e representa o log-odds geral de não inadimplência.

Os dados cr_loan_clean foram carregados no workspace junto com o modelo anterior clf_logistic_single.

Este exercicio faz parte do curso

Modelagem de Risco de Crédito em Python

Ver curso

Instruções do exercicio

Crie um novo conjunto de dados X com loan_int_rate e person_emp_length. Armazene-o como X_multi.
Crie um conjunto de dados y contendo apenas loan_status.
Crie e chame .fit() em um modelo LogisticRegression() com os novos dados X. Armazene-o como clf_logistic_multi.
Imprima o valor de .intercept_ do modelo

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create X data for the model
X_multi = ____[[____,____]]

# Create a set of y data for training
y = ____[[____]]

# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))

# Print the intercept of the model
print(____.____)

Editar e Executar Código