Eindmodel voor classificatie bouwen
Bij het vergelijken van de recall-prestatie tussen het logistieke regressiemodel (0,4) en het best presterende random-forestmodel (0,2), heb je gezien dat het model met de beste prestatie het logistieke regressiemodel is. In deze oefening bouw je het logistieke regressiemodel met alle train-data en bereid je de nodige vectoren voor om de test-prestatie van dit model te evalueren.
Deze oefening maakt deel uit van de cursus
Machine Learning in de tidyverse
Oefeninstructies
- Bouw een logistiek regressiemodel dat
Attritionvoorspelt met alle beschikbare features intraining_data. - Bereid de binaire vector met de werkelijke testwaarden voor,
test_actual. - Bereid de binaire vector met voorspelde waarden voor, waarbij een kans groter dan 0,5
TRUEaangeeft, en sla dit op alstest_predicted.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Build the logistic regression model using all training data
best_model <- glm(formula = ___,
data = ___, family = "binomial")
# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"
# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___