1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 Feature Engineering

Connected

연습 문제

준비 단계 다지기

PCA 관점에서 attrition_num 데이터셋을 탐색해, 정보를 최대한 보존하면서 차원을 줄일 수 있는지 확인해 보세요. 우선 거의-영 분산(near-zero variance) 피처를 걸러내고, 데이터를 정규화한 다음, PCA를 적용하는 레시피를 만들어 보겠습니다.

attrition_num 데이터셋은 이미 로드되어 있습니다.

지침

100 XP
  • 발생 가능성이 있는 거의-영 분산 피처를 제거하세요.
  • 모든 수치형 데이터를 정규화하세요.
  • PCA를 적용하세요.
  • 레시피를 준비(prep)하여 출력 요소의 이름에 접근하세요.