1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 Feature Engineering

Connected

연습 문제

결측값 대치와 더미 변수 생성

attrition 데이터셋에서 결측값을 확인하고, 결측이 완전 무작위(MCAR)라고 판단했으므로 K 최근접 이웃(KNN) 대치를 사용하기로 합니다. 특성 공학 recipe를 구성하는 동안 모든 명목형 변수에 대해 더미 변수를 만들고, ...1 변수의 역할을 "ID"로 업데이트하여 모델에 영향을 주지 않으면서도 참조용으로 데이터셋에 유지하기로 합니다.

지침

100 XP
  • ...1의 역할을 "ID"로 업데이트하세요.
  • 결측이 있는 모든 예측 변수에 값을 대치하세요.
  • 모든 명목형 예측 변수에 대해 더미 변수를 생성하세요.