1. 학습
  2. /
  3. 강의
  4. /
  5. R로 연습하는 통계 면접 질문

Connected

연습 문제

PCA - 차원 축소

이전 연습 문제에서는 변수 두 개가 있는 데이터셋을 다뤘어요. 면접에서는 더 큰 데이터셋을 마주칠 가능성이 높습니다.

PCA는 정보 손실을 크게 늘리지 않으면서 변수의 개수를 줄일 수 있게 해줘요.

PCA는 원래 데이터셋과 같은 크기의 데이터를 반환합니다. 몇 개의 변수를 남길지는 여러분이 결정해요!

prcomp()의 다음 매개변수는 아래 기준으로 차원을 축소합니다:

  • tol - 첫 번째 주성분의 표준편차 대비 백분율로 표현한 표준편차 임계값,
  • rank - 사용할 최대 주성분 개수.

letters 데이터셋에는 문자에 대한 수치형 속성이 들어 있어요.

지침 1/3

undefined XP
  • 1

    주성분을 식별하고, 각 주성분이 설명하는 분산의 비율을 보여주세요.

  • 2

    표준편차가 첫 번째 주성분의 표준편차의 0.25보다 작은 성분을 생략하세요.

  • 3

    주성분의 개수를 7개로 제한하세요.