ComeçarComece de graça

Construindo modelos simples de regressão logística

O conjunto de dados donors contém 93.462 exemplos de pessoas que receberam pelo correio uma solicitação de doação para veteranos militares paralisados. A coluna donated é 1 se a pessoa fez uma doação em resposta ao envio e 0 caso contrário. Esse desfecho binário será a variável dependente do modelo de regressão logística.

As demais colunas são características dos possíveis doadores que podem influenciar seu comportamento de doação. Elas são as variáveis independentes do modelo.

Ao construir um modelo de regressão, costuma ajudar formular uma hipótese sobre quais variáveis independentes serão preditivas da variável dependente. A coluna bad_address, que vale 1 para um endereço postal inválido e 0 caso contrário, parece reduzir as chances de doação. Da mesma forma, pode-se suspeitar que interesse religioso (interest_religion) e interesse em assuntos de veteranos (interest_veterans) estejam associados a maior doação.

Neste exercício, você vai usar esses três fatores para criar um modelo simples do comportamento de doação. O conjunto de dados donors está disponível para você usar.

Este exercício faz parte do curso

Aprendizagem supervisionada em R: Classificação

Ver curso

Instruções do exercício

  • Examine donors usando a função str().
  • Conte o número de ocorrências de cada nível da variável donated usando a função table().
  • Ajuste um modelo de regressão logística usando a interface de fórmula com as três variáveis independentes descritas anteriormente.
    • Chame glm() com a fórmula como primeiro argumento e o data frame como argumento data.
    • Salve o resultado como donation_model.
  • Resuma o objeto do modelo com summary().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Examine the dataset to identify potential independent variables


# Explore the dependent variable


# Build the donation model
donation_model <- glm(___, 
                      data = ___, family = "___")

# Summarize the model results
Editar e executar o código