1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Unsupervised Learning

Connected

연습 문제

PCA 특징의 분산

fish 데이터셋은 6차원입니다. 그렇다면 이 데이터의 고유 차원(intrinsic dimension)은 얼마일까요? 이를 알아보기 위해 PCA 특징들의 분산을 그래프로 그려 보세요. 이전과 마찬가지로 samples는 2차원 배열이며, 각 행이 하나의 물고기를 나타냅니다. 먼저 특징들을 표준화해야 합니다.

지침

100 XP
  • StandardScaler 인스턴스 scaler를 만드세요.
  • PCA 인스턴스 pca를 만드세요.
  • make_pipeline() 함수를 사용해 scaler와 pca를 연결한 파이프라인을 만드세요.
  • pipeline의 .fit() 메서드를 사용해 물고기 샘플 samples에 맞추세요.
  • pca의 .n_components_ 속성을 사용해 사용된 구성 요소 개수를 추출하고, 이를 range() 함수에 넣어 features로 저장하세요.
  • plt.bar() 함수를 사용해 설명된 분산을 그리되, x축에는 features, y축에는 pca.explained_variance_를 사용하세요.