LoslegenKostenlos loslegen

Finales Klassifikationsmodell erstellen

Beim Vergleich der Recall-Leistung zwischen dem logistischen Regressionsmodell (0,4) und dem bestperformenden Random-Forest-Modell (0,2) hast du gelernt, dass das logistische Regressionsmodell am besten abschneidet. In dieser Übung baust du das logistische Regressionsmodell mit allen Train-Daten und bereitest die nötigen Vektoren vor, um die Test-Leistung dieses Modells zu evaluieren.

Diese Übung ist Teil des Kurses

Machine Learning im Tidyverse

Kurs anzeigen

Anleitung zur Übung

  • Erstelle ein logistisches Regressionsmodell zur Vorhersage von Attrition mit allen verfügbaren Features in training_data.
  • Bereite den binären Vektor der tatsächlichen Testwerte test_actual vor.
  • Bereite den binären Vektor der vorhergesagten Werte vor, wobei eine Wahrscheinlichkeit größer als 0,5 TRUE bedeutet, und speichere diesen als test_predicted.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Build the logistic regression model using all training data
best_model <- glm(formula = ___, 
                  data = ___, family = "binomial")


# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"

# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___
Code bearbeiten und ausführen