1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

अभ्यास

스크리 플롯으로 주성분 시각화하기

Machine Learning 면접에서는 어떤 수의 특성을 유지하는 것이 최적인지 묻는 경우가 있어요. 이 연습 문제에서는 loan_data에 PCA를 적용해 주성분의 스크리 플롯과 누적 설명 분산 비율 플롯을 만들어 보겠습니다. 이를 통해 앞으로 더 정확한 ML 모델을 학습할 때 사용할 최적의 PC 수를 결정하는 데 도움을 받을 수 있어요.

PCA는 비지도 학습 방법이므로, 대상 변수 Loan Status를 제거한 X 행렬에 대해 주성분 분석을 수행합니다. n_components를 설정하지 않으면, 학습된 모델에서 모든 주성분이 반환됩니다.

निर्देश 1/4

undefined XP
  • 1
    • 대상 변수를 제거해 데이터 행렬 X를 만드세요.
    • 10개의 PC를 반환하는 PCA 객체를 생성하고, 학습(fit) 및 변환(transform)하세요.
  • 2
    • Variance Explained를 설명 분산 비율에 매핑하는 DataFrame을 만드세요.
    • pca_df로부터 스크리 플롯을 만들고, x축에는 PC, y축에는 설명 분산을 설정하세요.
  • 3
    • n_components를 설정하지 않고 PCA 객체를 생성한 뒤, 학습 및 변환하세요.
    • 설명 분산 비율을 출력하세요.
  • 4
    • 이전 단계의 설명 분산 비율에 대한 누적합을 cumulative_var에 할당하세요.
    • 결과를 플로팅하세요.