1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 Feature Engineering

Connected

연습 문제

전처리

이제 본격적으로 Feature engineering을 해 볼 시간이에요! 관측 ID처럼 정보력이 낮지만 잠재적으로 유용할 수 있는 변수를 처리하고, 결측값도 다뤄야 해요. 또한 일부 예측 변수를 변환할 기회이기도 해요. 예를 들어, 수치형 특성은 정규화하고 범주형 특성은 더미 변수를 만들어 보세요.

이전 연습 문제에서 생성한 attrition 데이터셋과 train 및 test 분할이 환경에 준비되어 있어요.

지침

100 XP
  • 모든 수치형 특성을 정규화하세요.
  • knn 대치 알고리즘을 사용해 결측값을 대치하세요.
  • 모든 명목형 예측 변수에 대해 더미 변수를 생성하세요.