1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 Feature Engineering

Connected

연습 문제

Yeo-Johnson 변환

회사에서 퇴사한 직원에 대한 모든 수치형 데이터가 담긴 attrition_num 데이터셋을 사용해, factor로 코딩된 이진 변수 Attrition을 타깃으로 직원이 계속 근무할 가능성을 예측하는 모델을 만들려고 합니다. 피처들의 분포를 정규분포에 가깝게 만들기 위해 Yeo-Johnson 변환을 적용하는 레시피를 생성하겠습니다.

attrition_num 데이터, 로지스틱 회귀 lr_model, 사용자 정의 함수 class-evaluate(), 그리고 train 및 test 분할이 미리 로드되어 있습니다.

지침

100 XP
  • 타깃을 포함한 모든 수치형 피처에 Yeo-Johnson을 적용하는 레시피를 만드세요.