Regressão logística básica
No vídeo, você analisou um modelo de regressão logística incluindo a variável age como preditora. Agora, você vai incluir uma variável categórica e aprender como interpretar as estimativas de seus parâmetros.
Ao incluir uma variável categórica em um modelo de regressão logística no R, você obterá uma estimativa de parâmetro para todas as suas categorias, exceto uma. Essa categoria para a qual não é fornecida estimativa é chamada de categoria de referência. O parâmetro de cada uma das outras categorias representa a razão de chances a favor de inadimplência do empréstimo entre a categoria de interesse e a categoria de referência. Não se preocupe se isso ainda não estiver totalmente claro — você fará mais exercícios sobre isso em seguida!
Este exercício faz parte do curso
Modelagem de Risco de Crédito em R
Instruções do exercício
- Construa um modelo de regressão logística chamado
log_model_catcom a variável categóricair_catcomo única preditora. Sua chamada a glm() deve conter três argumentos: loan_status ~ ir_catfamily = "binomial"data = training_set- Veja o resultado no console para conferir as estimativas dos parâmetros.
- Descubra qual é a categoria de referência olhando novamente para a estrutura de
ir_cat(no conjunto de dados completoloan_data). Use a funçãotable()para isso.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Build a glm model with variable ir_cat as a predictor
# Print the parameter estimates
# Look at the different categories in ir_cat using table()