Kreuzvalidierte Performance berechnen

Es ist entscheidend, Modelle mit einer sorgfältig ausgewählten Kennzahl zu optimieren, die auf das Ziel des Modells ausgerichtet ist.

Stell dir vor, du möchtest dieses Modell nutzen, um Mitarbeitende zu identifizieren, die voraussichtlich das Unternehmen verlassen. Ideal wäre ein Modell, das möglichst viele der kündigungsbereiten Mitarbeitenden erkennt, damit du eingreifen kannst. Die passende Kennzahl dafür ist der Recall. Daher verwendest du ausschließlich Recall, um deine Modelle zu optimieren und auszuwählen.

Diese Übung ist Teil des Kurses

Machine Learning im Tidyverse

Kurs anzeigen

Anleitung zur Übung

Berechne den Recall, indem du für jeden Fold die tatsächlichen mit den vorhergesagten Antworten vergleichst, und schreibe ihn in die Spalte validate_recall.
Gib die Spalte validate_recall aus.
Gib den Mittelwert dieser Spalte aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_lr %>% 
  mutate(validate_recall = map2_dbl(___, ___, 
                                    ~recall(actual = .x, predicted = .y)))

# Print the validate_recall column
cv_perf_recall$___

# Calculate the average of the validate_recall column
___

Code bearbeiten und ausführen