1. 학습
  2. /
  3. 프로젝트
  4. /
  5. HR Analytics: R로 직원 이탈 예측하기

Connected

연습 문제

HR 데이터셋 결합 (I)

이제 다양한 소스의 데이터셋을 결합해 볼 시간이에요. 여기서는 직원의 성과 평가 데이터를 직원 ID를 기준 키로 사용해 org2와 결합합니다. rating 데이터셋에는 2013년의 성과 평가가 들어 있어요.

Performance Rating의 레벨은 다음과 같아요:

  • Unacceptable
  • Below Average
  • Acceptable
  • Above Average
  • Excellent

두 데이터셋을 결합하려면 left_join() 함수를 사용할 수 있어요.

예를 들어, left_join(x, y, by = "z")는 y를 x에 조인합니다. 두 번째로 지정한 데이터셋이 첫 번째 데이터셋에 "z"를 조회 키로 사용하여 결합돼요.

지침

100 XP
  • glimpse()로 rating 데이터셋의 구조를 확인하세요.
  • 조회 키로 "emp_id"를 사용해 rating을 org2에 left join 하세요.
  • 각 rating 레벨별 이직률을 계산하세요.