Aan de slagGa gratis aan de slag

Eindmodel voor classificatie bouwen

Bij het vergelijken van de recall-prestatie tussen het logistieke regressiemodel (0,4) en het best presterende random-forestmodel (0,2), heb je gezien dat het model met de beste prestatie het logistieke regressiemodel is. In deze oefening bouw je het logistieke regressiemodel met alle train-data en bereid je de nodige vectoren voor om de test-prestatie van dit model te evalueren.

Deze oefening maakt deel uit van de cursus

Machine Learning in de tidyverse

Cursus bekijken

Oefeninstructies

  • Bouw een logistiek regressiemodel dat Attrition voorspelt met alle beschikbare features in training_data.
  • Bereid de binaire vector met de werkelijke testwaarden voor, test_actual.
  • Bereid de binaire vector met voorspelde waarden voor, waarbij een kans groter dan 0,5 TRUE aangeeft, en sla dit op als test_predicted.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Build the logistic regression model using all training data
best_model <- glm(formula = ___, 
                  data = ___, family = "binomial")


# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"

# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___
Code bewerken en uitvoeren