Construindo modelos simples de regressão logística
O conjunto de dados donors contém 93.462 exemplos de pessoas que receberam pelo correio uma solicitação de doação para veteranos militares paralisados. A coluna donated é 1 se a pessoa fez uma doação em resposta ao envio e 0 caso contrário. Esse desfecho binário será a variável dependente do modelo de regressão logística.
As demais colunas são características dos possíveis doadores que podem influenciar seu comportamento de doação. Elas são as variáveis independentes do modelo.
Ao construir um modelo de regressão, costuma ajudar formular uma hipótese sobre quais variáveis independentes serão preditivas da variável dependente. A coluna bad_address, que vale 1 para um endereço postal inválido e 0 caso contrário, parece reduzir as chances de doação. Da mesma forma, pode-se suspeitar que interesse religioso (interest_religion) e interesse em assuntos de veteranos (interest_veterans) estejam associados a maior doação.
Neste exercício, você vai usar esses três fatores para criar um modelo simples do comportamento de doação. O conjunto de dados donors está disponível para você usar.
Este exercício faz parte do curso
Aprendizagem supervisionada em R: Classificação
Instruções do exercício
- Examine
donorsusando a funçãostr(). - Conte o número de ocorrências de cada nível da variável
donatedusando a funçãotable(). - Ajuste um modelo de regressão logística usando a interface de fórmula com as três variáveis independentes descritas anteriormente.
- Chame
glm()com a fórmula como primeiro argumento e o data frame como argumentodata. - Salve o resultado como
donation_model.
- Chame
- Resuma o objeto do modelo com
summary().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Examine the dataset to identify potential independent variables
# Explore the dependent variable
# Build the donation model
donation_model <- glm(___,
data = ___, family = "___")
# Summarize the model results