LoslegenKostenlos loslegen

Teile die Daten auf

In dieser Übung teilst du deine Daten mit dem Paket caret in Trainings- und Testsätze auf. In den nächsten Lektionen verwendest du den Trainingssatz, um logistische Regressionsmodelle zu erstellen, und den Testsatz, um diese Modelle zu validieren.

Diese Übung ist Teil des Kurses

HR Analytics: Mitarbeiterfluktuation in R vorhersagen

Kurs anzeigen

Anleitung zur Übung

  • Lade das Paket caret.
  • Setze den Seed auf 567 und erstelle eine Datenpartition, die den Datensatz emp_final im Verhältnis 70 %/30 % in Train-/Test-Bereiche unterteilt.
  • Erstelle den Trainingsdatensatz, indem du die in index_train gespeicherten Zeilennummern aus dem Datensatz emp_final auswählst.
  • Weise die übrigen Beobachtungen aus emp_final dem Testsatz zu.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load caret
___

# Set seed of 567
___

# Store row numbers for training dataset: index_train
index_train <- ___(emp_final$turnover, p = ___, list = FALSE)

# Create training dataset: train_set
train_set <- emp_final[___, ]

# Create testing dataset: test_set
test_set <- emp_final[___, ]
Code bearbeiten und ausführen