Finales Klassifikationsmodell erstellen
Beim Vergleich der Recall-Leistung zwischen dem logistischen Regressionsmodell (0,4) und dem bestperformenden Random-Forest-Modell (0,2) hast du gelernt, dass das logistische Regressionsmodell am besten abschneidet. In dieser Übung baust du das logistische Regressionsmodell mit allen Train-Daten und bereitest die nötigen Vektoren vor, um die Test-Leistung dieses Modells zu evaluieren.
Diese Übung ist Teil des Kurses
Machine Learning im Tidyverse
Anleitung zur Übung
- Erstelle ein logistisches Regressionsmodell zur Vorhersage von
Attritionmit allen verfügbaren Features intraining_data. - Bereite den binären Vektor der tatsächlichen Testwerte
test_actualvor. - Bereite den binären Vektor der vorhergesagten Werte vor, wobei eine Wahrscheinlichkeit größer als 0,5
TRUEbedeutet, und speichere diesen alstest_predicted.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Build the logistic regression model using all training data
best_model <- glm(formula = ___,
data = ___, family = "binomial")
# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"
# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___