Membagi data
Dalam latihan ini, Anda akan membagi data menjadi himpunan pelatihan dan pengujian menggunakan paket caret. Pada rangkaian pelajaran berikutnya, Anda akan menggunakan himpunan pelatihan untuk membangun model regresi logistik dan menggunakan himpunan pengujian untuk memvalidasi model tersebut.
Latihan ini merupakan bagian dari kursus
Analitik SDM: Memprediksi Pergantian Karyawan dengan R
Instruksi latihan
- Muat paket
caret. - Tetapkan seed 567 dan buat pemisahan data yang membagi himpunan data
emp_finalke bagian pelatihan/pengujian 70%/30%. - Buat himpunan data pelatihan dengan memilih nomor baris yang disimpan di
index_traindari himpunan dataemp_final. - Tempatkan sisa observasi dari
emp_finalke himpunan pengujian.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Load caret
___
# Set seed of 567
___
# Store row numbers for training dataset: index_train
index_train <- ___(emp_final$turnover, p = ___, list = FALSE)
# Create training dataset: train_set
train_set <- emp_final[___, ]
# Create testing dataset: test_set
test_set <- emp_final[___, ]