Mengonfirmasi pemisahan data
Pada latihan sebelumnya, Anda membagi himpunan data menjadi train_set dan test_set. Penting untuk memastikan bahwa data yang Anda gunakan untuk melatih model merepresentasikan test_set. Jadi, mari pastikan train_set dan test_set memiliki proporsi karyawan aktif dan tidak aktif yang sama.
Latihan ini adalah bagian dari kursus
Analitik SDM: Memprediksi Pergantian Karyawan dengan R
Petunjuk latihan
Hitung proporsi karyawan Active dan Inactive dalam train_set dan test_set.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate turnover proportion in train_set
train_set %>%
___(status) %>%
___(prop = n / sum(n))
# Calculate turnover proportion in test_set
test_set %>%
___(status) %>%
___(prop = n / sum(n))