Pisahkan himpunan train dan test
Langkah pertama saat melatih model adalah membagi data menjadi himpunan train dan test. Paket tidymodels memudahkan hal ini. Menyisihkan himpunan data test memungkinkan Anda mengevaluasi model terlatih pada data yang belum pernah dilihat model.
Anda akan menggunakan data attrition karyawan di bidang layanan kesehatan yang memuat data tentang karyawan sebuah perusahaan layanan kesehatan dan apakah mereka keluar dari perusahaan atau tidak. Data tersedia dalam attrition_df. Variabel target adalah Attrition.
Paket tidyverse dan tidymodels telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Reduksi Dimensi di R
Petunjuk latihan
- Inisialisasi pemisahan data dengan 80% untuk pelatihan dan lakukan stratifikasi berdasarkan
Attrition, variabel target. - Ekstrak himpunan data pelatihan dan simpan dalam
train. - Ekstrak himpunan data pengujian dan simpan dalam
test.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Initialize the split
split <- ___(___, ___ = ___, strata = ___)
# Extract training set
train <- ___ %>% ___()
# Extract testing set
test <- ___ %>% ___()