Membagi data
Dalam latihan ini, Anda akan membagi data menjadi himpunan pelatihan dan pengujian menggunakan paket caret. Pada rangkaian pelajaran berikutnya, Anda akan menggunakan himpunan pelatihan untuk membangun model regresi logistik dan menggunakan himpunan pengujian untuk memvalidasi model tersebut.
Latihan ini adalah bagian dari kursus
Analitik SDM: Memprediksi Pergantian Karyawan dengan R
Petunjuk latihan
- Muat paket
caret. - Tetapkan seed 567 dan buat pemisahan data yang membagi himpunan data
emp_finalke bagian pelatihan/pengujian 70%/30%. - Buat himpunan data pelatihan dengan memilih nomor baris yang disimpan di
index_traindari himpunan dataemp_final. - Tempatkan sisa observasi dari
emp_finalke himpunan pengujian.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load caret
___
# Set seed of 567
___
# Store row numbers for training dataset: index_train
index_train <- ___(emp_final$turnover, p = ___, list = FALSE)
# Create training dataset: train_set
train_set <- emp_final[___, ]
# Create testing dataset: test_set
test_set <- emp_final[___, ]