ComenzarEmpieza gratis

Construir modelos sencillos de regresión logística

El conjunto de datos donors contiene 93.462 ejemplos de personas enviadas por correo en una solicitud de recaudación de fondos para veteranos militares paralíticos. La columna donated es 1 si la persona hizo una donación en respuesta al envío y 0 en caso contrario. Este resultado binario será la variable dependiente del modelo de regresión logística.

Las columnas restantes son características de los posibles donantes que pueden influir en su comportamiento de donación. Son las variables independientes del modelo.

Al construir un modelo de regresión, suele ser útil formular una hipótesis sobre qué variables independientes serán predictoras de la variable dependiente. La columna bad_address, que se establece en 1 para una dirección postal no válida y 0 en caso contrario, parece que podría reducir las posibilidades de una donación. Del mismo modo, cabría sospechar que el interés religioso (interest_religion) y el interés por los asuntos de los veteranos (interest_veterans) estarían asociados a una mayor donación benéfica.

En este ejercicio, utilizarás estos tres factores para crear un modelo sencillo de comportamiento de donación. El conjunto de datos donors está disponible para que lo utilices.

Este ejercicio forma parte del curso

Aprendizaje supervisado en R: Clasificación

Ver curso

Instrucciones de ejercicio

  • Examina donors utilizando la función str().

  • Cuenta el número de apariciones de cada nivel de la variable donated utilizando la función table().

  • Ajusta un modelo de regresión logística utilizando la interfaz de fórmulas con las tres variables independientes descritas anteriormente.

    • Llama a glm() con la fórmula como primer argumento y el marco de datos como argumento data.

    • Guarda el resultado como donation_model.

  • Resume el objeto modelo con summary().

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Examine the dataset to identify potential independent variables


# Explore the dependent variable


# Build the donation model
donation_model <- glm(___, 
                      data = ___, family = "___")

# Summarize the model results
Editar y ejecutar código