1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 추천 엔진 만들기

Connected

연습 문제

추천 방법 비교하기

이 강의에서 여러분은 여러 방법(기본 평균 평점, KNN, 행렬 분해)을 사용해 사용자가 아직 보지 않은 영화에 어떤 평점을 줄지 예측해 보셨어요. 마지막 연습 문제에서는 평균 평점 기반 예측과 행렬 분해 기반 예측을 mean_squared_error()로 성능을 비교해 볼 거예요. 평균 기반 예측 결과는 avg_pred_ratings_df로, 계산된(모델 기반) 예측 결과는 calc_pred_ratings_df로 로드되어 있어요. 정답(ground truth) 값은 act_ratings_df로 로드되어 있어요.

마지막으로, mean_squared_error() 함수는 sklearn.metrics에서 가져와 사용할 수 있도록 임포트되어 있어요.

지침

100 XP
  • act_ratings_df, avg_pred_ratings_df, calc_pred_ratings_df DataFrame에서 비교할 영역인 행 0–20과 열 0–100을 추출하세요.
  • 비어 있지 않은 셀만 대상으로 하는 actual_values DataFrame의 마스크를 만드세요.
  • 두 가지 예측값과 ground truth 값 사이의 평균제곱오차를 구하세요.