Kreuzvalidierte Performance berechnen
Es ist entscheidend, Modelle mit einer sorgfältig ausgewählten Kennzahl zu optimieren, die auf das Ziel des Modells ausgerichtet ist.
Stell dir vor, du möchtest dieses Modell nutzen, um Mitarbeitende zu identifizieren, die voraussichtlich das Unternehmen verlassen. Ideal wäre ein Modell, das möglichst viele der kündigungsbereiten Mitarbeitenden erkennt, damit du eingreifen kannst. Die passende Kennzahl dafür ist der Recall. Daher verwendest du ausschließlich Recall, um deine Modelle zu optimieren und auszuwählen.
Diese Übung ist Teil des Kurses
Machine Learning im Tidyverse
Anleitung zur Übung
- Berechne den Recall, indem du für jeden Fold die tatsächlichen mit den vorhergesagten Antworten vergleichst, und schreibe ihn in die Spalte
validate_recall. - Gib die Spalte
validate_recallaus. - Gib den Mittelwert dieser Spalte aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_lr %>%
mutate(validate_recall = map2_dbl(___, ___,
~recall(actual = .x, predicted = .y)))
# Print the validate_recall column
cv_perf_recall$___
# Calculate the average of the validate_recall column
___