LoslegenKostenlos starten

Teile die Daten auf

In dieser Übung teilst du deine Daten mit dem Paket caret in Trainings- und Testsätze auf. In den nächsten Lektionen verwendest du den Trainingssatz, um logistische Regressionsmodelle zu erstellen, und den Testsatz, um diese Modelle zu validieren.

Diese Übung ist Teil des Kurses

<Kurs>HR Analytics: Mitarbeiterfluktuation in R vorhersagen</Kurs>
Kurs ansehen

Übungsanweisungen

  • Lade das Paket caret.
  • Setze den Seed auf 567 und erstelle eine Datenpartition, die den Datensatz emp_final im Verhältnis 70 %/30 % in Train-/Test-Bereiche unterteilt.
  • Erstelle den Trainingsdatensatz, indem du die in index_train gespeicherten Zeilennummern aus dem Datensatz emp_final auswählst.
  • Weise die übrigen Beobachtungen aus emp_final dem Testsatz zu.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Load caret
___

# Set seed of 567
___

# Store row numbers for training dataset: index_train
index_train <- ___(emp_final$turnover, p = ___, list = FALSE)

# Create training dataset: train_set
train_set <- emp_final[___, ]

# Create testing dataset: test_set
test_set <- emp_final[___, ]
Code bearbeiten und ausführen