Especificação e estimação do modelo
Você já viu o comando glm() para rodar uma regressão logística. glm() significa generalized linear model e oferece toda uma família de modelos de regressão.
Use o conjunto de dados do exercício para esta tarefa de código. Os dados defaultData de que você precisa estão disponíveis no seu ambiente e prontos para modelagem.
Este exercício faz parte do curso
Machine Learning for Marketing Analytics in R
Instruções do exercício
- Use a função
glm()para modelar a probabilidade de um cliente entrar em inadimplência usando uma regressão logística. Inclua todas as variáveis explicativas do conjunto de dados e especifique os dados que devem ser usados. - Não se esqueça de especificar o argumento
family. - Extraia os coeficientes do modelo, depois transforme-os em odds ratios e arredonde.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Build logistic regression model
logitModelFull <- ___(PaymentDefault ~ limitBal + sex + education + marriage +
age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 +
billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 +
payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6,
family = ___, data = ___)
# Take a look at the model
___(logitModelFull)
# Take a look at the odds ratios
coefsexp <- ___(logitModelFull) %>% ___ %>% round(2)
coefsexp