1. 학습
  2. /
  3. 프로젝트
  4. /
  5. HR Analytics: R로 살펴보는 직원 데이터

Connected

연습 문제

사고 데이터 불러오기와 조인

마지막 챕터예요! 여기까지 오신 것을 축하드립니다. 이번 챕터의 시나리오는 한 임원이 생산 현장에서 지난 1년에 걸쳐 산업재해가 늘었다고 믿고 있다는 것입니다. 실제로 그런지 확인하고, 사실이라면 증가의 원인이 무엇인지 파악해 달라고 요청했어요.

먼저 HR 데이터와 사고 데이터를 불러오세요. 그런 다음 두 데이터를 조인하고, 사고 발생률 분석을 쉽게 하기 위해 had_accident 변수를 추가하세요.

지침

100 XP
  • read_csv()로 "hr_data_2.csv"와 "accident_data.csv"를 불러오세요. 각각 hr_data와 accident_data에 할당하세요.
  • left_join()을 사용해 사고 데이터를 HR 데이터에 추가하세요. 직원 ID와 연도를 모두 키로 사용해 조인하세요.
  • 조인 뒤에 %>%를 사용해 mutate()로 had_accident를 추가하세요. accident_type이 NA이면 0, 그렇지 않으면 1이 되도록 하세요.