Überprüfe die Aufteilung
In der vorherigen Übung hast du den Datensatz in train_set und test_set aufgeteilt. Es ist wichtig sicherzustellen, dass die Daten, mit denen du dein Modell trainierst, repräsentativ für den Testdatensatz sind. Lass uns also prüfen, dass sowohl train_set als auch test_set den gleichen Anteil aktiver und inaktiver Mitarbeitender haben.
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation in R vorhersagen
Anleitung zur Übung
Berechne den Anteil der Active- und Inactive-Mitarbeitenden in train_set und test_set.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate turnover proportion in train_set
train_set %>%
___(status) %>%
___(prop = n / sum(n))
# Calculate turnover proportion in test_set
test_set %>%
___(status) %>%
___(prop = n / sum(n))