1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Python으로 추천 엔진 만들기

Connected

अभ्यास

행렬 분해하기

이제 데이터를 중심화하고 남은 빈 값을 0으로 채워 전처리를 마쳤으니, 데이터의 요인을 찾아볼 차례예요. 이번 연습 문제에서는 이전 문제에서 만든 user_ratings_centered 데이터를 세 가지 요인 U, sigma, Vt로 분해해 볼 거예요.

  • U는 사용자마다 한 행을 갖는 행렬이에요.
  • Vt는 영화마다 한 열을 갖고 있어요.
  • sigma는 가중치 배열이며, 이를 대각 행렬로 변환해야 해요.

이전 레슨에서 생성한 user_ratings_centered는 이미 로드되어 있어요.

निर्देश 1/2

undefined XP
  • 1
    • scipy.sparse.linalg에서 svds를 임포트하세요.
    • user_ratings_pivot_centered를 요인 행렬 U, sigma, Vt로 분해하세요.
  • 2
    • sigma 배열을 대각 행렬로 변환하세요.