MulaiMulai sekarang secara gratis

Membagi data

Dalam latihan ini, Anda akan membagi data menjadi himpunan pelatihan dan pengujian menggunakan paket caret. Pada rangkaian pelajaran berikutnya, Anda akan menggunakan himpunan pelatihan untuk membangun model regresi logistik dan menggunakan himpunan pengujian untuk memvalidasi model tersebut.

Latihan ini adalah bagian dari kursus

Analitik SDM: Memprediksi Pergantian Karyawan dengan R

Lihat Kursus

Petunjuk latihan

  • Muat paket caret.
  • Tetapkan seed 567 dan buat pemisahan data yang membagi himpunan data emp_final ke bagian pelatihan/pengujian 70%/30%.
  • Buat himpunan data pelatihan dengan memilih nomor baris yang disimpan di index_train dari himpunan data emp_final.
  • Tempatkan sisa observasi dari emp_final ke himpunan pengujian.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load caret
___

# Set seed of 567
___

# Store row numbers for training dataset: index_train
index_train <- ___(emp_final$turnover, p = ___, list = FALSE)

# Create training dataset: train_set
train_set <- emp_final[___, ]

# Create testing dataset: test_set
test_set <- emp_final[___, ]
Edit dan Jalankan Kode