특이값 분해(SVD)

이전 연습 문제에서는 Machine Learning 인터뷰에서 고차원성에 관한 질문을 받았을 때, PCA가 데이터셋의 차원을 줄이는 데 얼마나 유용한지 살펴봤어요.

이번 연습에서는 diabetes 데이터셋에 SVD를 적용해 보겠습니다. 이 변환기는 PCA와 달리 희소 행렬에서도 효율적으로 작동하며, 절단 특이값 분해(truncated singular value decomposition)를 통해 선형 차원 축소를 수행해요.

특이값 분해는 원본 데이터 행렬을 세 개의 행렬로 분해하고, 이를 이용해 특이값을 계산해 반환한다는 점을 기억하세요.