ComenzarEmpieza gratis

Construye el modelo de clasificación final

Al comparar el rendimiento de recall entre el modelo de regresión logística (0.4) y el mejor modelo de random forest (0.2), has visto que el modelo con mejor desempeño es el de regresión logística. En este ejercicio, construirás el modelo de regresión logística usando todos los datos de train y prepararás los vectores necesarios para evaluar el rendimiento en test de este modelo.

Este ejercicio forma parte del curso

Machine Learning en el tidyverse

Ver curso

Instrucciones del ejercicio

  • Construye un modelo de regresión logística que prediga Attrition utilizando todas las variables disponibles en training_data.
  • Prepara el vector binario de valores reales de prueba, test_actual.
  • Prepara el vector binario de valores predichos donde una probabilidad mayor que 0.5 indica TRUE y guárdalo como test_predicted.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Build the logistic regression model using all training data
best_model <- glm(formula = ___, 
                  data = ___, family = "binomial")


# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"

# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___
Editar y ejecutar código