Überprüfe die Aufteilung
In der vorherigen Übung hast du den Datensatz in train_set und test_set aufgeteilt. Es ist wichtig sicherzustellen, dass die Daten, mit denen du dein Modell trainierst, repräsentativ für den Testdatensatz sind. Lass uns also prüfen, dass sowohl train_set als auch test_set den gleichen Anteil aktiver und inaktiver Mitarbeitender haben.
Diese Übung ist Teil des Kurses
<Kurs>HR Analytics: Mitarbeiterfluktuation in R vorhersagen</Kurs>Übungsanweisungen
Berechne den Anteil der Active- und Inactive-Mitarbeitenden in train_set und test_set.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Calculate turnover proportion in train_set
train_set %>%
___(status) %>%
___(prop = n / sum(n))
# Calculate turnover proportion in test_set
test_set %>%
___(status) %>%
___(prop = n / sum(n))