MulaiMulai sekarang secara gratis

Pisahkan himpunan train dan test

Langkah pertama saat melatih model adalah membagi data menjadi himpunan train dan test. Paket tidymodels memudahkan hal ini. Menyisihkan himpunan data test memungkinkan Anda mengevaluasi model terlatih pada data yang belum pernah dilihat model.

Anda akan menggunakan data attrition karyawan di bidang layanan kesehatan yang memuat data tentang karyawan sebuah perusahaan layanan kesehatan dan apakah mereka keluar dari perusahaan atau tidak. Data tersedia dalam attrition_df. Variabel target adalah Attrition.

Paket tidyverse dan tidymodels telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Reduksi Dimensi di R

Lihat Kursus

Petunjuk latihan

  • Inisialisasi pemisahan data dengan 80% untuk pelatihan dan lakukan stratifikasi berdasarkan Attrition, variabel target.
  • Ekstrak himpunan data pelatihan dan simpan dalam train.
  • Ekstrak himpunan data pengujian dan simpan dalam test.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Initialize the split
split <- ___(___, ___ = ___, strata = ___)

# Extract training set
train <- ___ %>% ___()

# Extract testing set
test <- ___ %>% ___()
Edit dan Jalankan Kode