Teile die Daten auf
In dieser Übung teilst du deine Daten mit dem Paket caret in Trainings- und Testsätze auf. In den nächsten Lektionen verwendest du den Trainingssatz, um logistische Regressionsmodelle zu erstellen, und den Testsatz, um diese Modelle zu validieren.
Diese Übung ist Teil des Kurses
<Kurs>HR Analytics: Mitarbeiterfluktuation in R vorhersagen</Kurs>Übungsanweisungen
- Lade das Paket
caret. - Setze den Seed auf 567 und erstelle eine Datenpartition, die den Datensatz
emp_finalim Verhältnis 70 %/30 % in Train-/Test-Bereiche unterteilt. - Erstelle den Trainingsdatensatz, indem du die in
index_traingespeicherten Zeilennummern aus dem Datensatzemp_finalauswählst. - Weise die übrigen Beobachtungen aus
emp_finaldem Testsatz zu.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Load caret
___
# Set seed of 567
___
# Store row numbers for training dataset: index_train
index_train <- ___(emp_final$turnover, p = ___, list = FALSE)
# Create training dataset: train_set
train_set <- emp_final[___, ]
# Create testing dataset: test_set
test_set <- emp_final[___, ]