1. 학습
  2. /
  3. 강의
  4. /
  5. HR Analytics: Python으로 직원 이탈 예측하기

Connected

연습 문제

더미 트랩

더미 트랩은 서로 다른 더미 변수가 동일한 정보를 담고 있는 상황을 말해요. 예를 들어, 어떤 직원이 회계 부서라면(즉 accounting 열의 값이 1이라면) 다른 어떤 부서에도 속하지 않음이 확실하죠(다른 열들의 값은 모두 0). 즉, 다른 모든 부서 더미를 보면 그 직원의 부서를 알아낼 수 있어요.

이 때문에 더미 변수가 $n$개 생성되면(여기서는 10개), 실제로는 \(n\) - 1개(여기서는 9개)만으로 충분하며, 마지막 $n$번째 열의 정보는 이미 포함되어 있어요.

따라서 기존의 department 열을 제거하고, 더미 트랩을 피하기 위해 부서 더미 중 하나를 삭제한 다음, 두 DataFrame을 결합할 거예요.

지침

100 XP
  • "더미 트랩"을 피하기 위해 accounting 열을 .drop() 하세요.
  • 더 이상 필요하지 않으므로 이전 department 열을 .drop() 하세요.
  • 새로운 departments DataFrame을 employee 데이터셋과 조인하세요(이 부분은 미리 처리해 두었습니다).