Teile die Daten auf
In dieser Übung teilst du deine Daten mit dem Paket caret in Trainings- und Testsätze auf. In den nächsten Lektionen verwendest du den Trainingssatz, um logistische Regressionsmodelle zu erstellen, und den Testsatz, um diese Modelle zu validieren.
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation in R vorhersagen
Anleitung zur Übung
- Lade das Paket
caret. - Setze den Seed auf 567 und erstelle eine Datenpartition, die den Datensatz
emp_finalim Verhältnis 70 %/30 % in Train-/Test-Bereiche unterteilt. - Erstelle den Trainingsdatensatz, indem du die in
index_traingespeicherten Zeilennummern aus dem Datensatzemp_finalauswählst. - Weise die übrigen Beobachtungen aus
emp_finaldem Testsatz zu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load caret
___
# Set seed of 567
___
# Store row numbers for training dataset: index_train
index_train <- ___(emp_final$turnover, p = ___, list = FALSE)
# Create training dataset: train_set
train_set <- emp_final[___, ]
# Create testing dataset: test_set
test_set <- emp_final[___, ]