1. Học hỏi
  2. /
  3. Dự An
  4. /
  5. Phân tích HR: Khám phá dữ liệu nhân sự bằng R

Connected

Bài tập

Nhập và nối dữ liệu tai nạn

Đây là chương cuối! Chúc mừng bạn đã đi đến đây. Kịch bản của chương này là một lãnh đạo cấp cao tin rằng số vụ tai nạn lao động tại các cơ sở sản xuất đã tăng trong năm qua. Bà ấy muốn bạn kiểm tra xem điều đó có đúng không, và nếu đúng, hãy tìm hiểu điều gì có thể đang khiến tỷ lệ tăng lên.

Bắt đầu bằng cách nhập các bộ dữ liệu HR và tai nạn. Sau đó nối chúng lại, và thêm biến had_accident để việc phân tích tỷ lệ tai nạn dễ dàng hơn.

Hướng dẫn

100 XP
  • Nhập "hr_data_2.csv" và "accident_data.csv" bằng read_csv(). Gán lần lượt cho hr_data và accident_data.
  • Dùng left_join() để thêm dữ liệu tai nạn vào dữ liệu HR. Join theo cả mã nhân viên và năm.
  • Sử dụng %>% sau khi join, dùng mutate() để thêm had_accident, bằng 0 khi accident_type là NA, và 1 nếu ngược lại.