Gambaran umum data master
Sejauh ini Anda telah menggabungkan informasi dari himpunan data rating dan survey dengan himpunan data asli Anda.
Kami menambahkan beberapa informasi lain terkait karyawan seperti compensation, no_leaves_taken (jumlah hari cuti yang diambil), hiring_source, dan lain-lain ke dalam himpunan data org_final. Silakan telusuri himpunan data ini sebelum melakukan rekayasa fitur pada chapter berikutnya.
Latihan ini adalah bagian dari kursus
Analitik SDM: Memprediksi Pergantian Karyawan dengan R
Petunjuk latihan
- Gunakan
glimpse()untuk melihat struktur himpunan dataorg_final. - Tetapkan jumlah variabel dalam himpunan data
org_finalkevariables. - Buat box plot untuk memvisualisasikan sebaran
distance_from_homebagi karyawanActivedanInactive.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# View the structure of the dataset
___
# Number of variables in the dataset
variables <- ___
# Compare the travel distance of Active and Inactive employees
ggplot(org_final, aes(x = ___, y = ___)) +
___