Construye el modelo de clasificación final
Al comparar el rendimiento de recall entre el modelo de regresión logística (0.4) y el mejor modelo de random forest (0.2), has visto que el modelo con mejor desempeño es el de regresión logística. En este ejercicio, construirás el modelo de regresión logística usando todos los datos de train y prepararás los vectores necesarios para evaluar el rendimiento en test de este modelo.
Este ejercicio forma parte del curso
Machine Learning en el tidyverse
Instrucciones del ejercicio
- Construye un modelo de regresión logística que prediga
Attritionutilizando todas las variables disponibles entraining_data. - Prepara el vector binario de valores reales de prueba,
test_actual. - Prepara el vector binario de valores predichos donde una probabilidad mayor que 0.5 indica
TRUEy guárdalo comotest_predicted.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Build the logistic regression model using all training data
best_model <- glm(formula = ___,
data = ___, family = "binomial")
# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"
# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___