1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 추천 엔진 만들기

Connected

연습 문제

분해에서의 정보 손실

열 수가 훨씬 적은 요인 행렬이 어떻게 더 큰 DataFrame을 손실 없이 요약할 수 있는지 궁금하실 수 있어요. 사실 완전히 그러진 않아요 — 우리가 만드는 요인 행렬은 일반적으로 원본 데이터의 근사값이며, 어느 정도 정보 손실은 불가피해요. 즉, 예측 값이 정확히 일치하진 않겠지만, 충분히 유용할 만큼 가까워야 해요.

이 연습 문제에서는 이전 문제에서와 같은 분해 전 원본 DataFrame인 original_df를 살펴보고, 두 요인인 user_matrix와 item_matrix의 곱과 비교해 볼 거예요.

지침

100 XP
  • user_matrix와 item_matrix의 내적을 구해 predictions_df로 저장하세요.