1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

연습 문제

특이값 분해(SVD)

이전 연습 문제에서는 Machine Learning 인터뷰에서 고차원성에 관한 질문을 받았을 때, PCA가 데이터셋의 차원을 줄이는 데 얼마나 유용한지 살펴봤어요.

이번 연습에서는 diabetes 데이터셋에 SVD를 적용해 보겠습니다. 이 변환기는 PCA와 달리 희소 행렬에서도 효율적으로 작동하며, 절단 특이값 분해(truncated singular value decomposition)를 통해 선형 차원 축소를 수행해요.

특이값 분해는 원본 데이터 행렬을 세 개의 행렬로 분해하고, 이를 이용해 특이값을 계산해 반환한다는 점을 기억하세요.

같은 파이프라인 단계에서 다른 기법을 사용해 봅니다: Machine learning pipeline

지침 1/4

undefined XP
    1
    2
    3
    4
  • SVD를 수행하기 위한 관련 모듈을 임포트하세요.
  • diabetes 데이터셋에서 progression을 사용해 특성 행렬 X와 타깃 배열 y를 생성하세요.