1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 추천 엔진 만들기

Connected

연습 문제

Jaccard 유사도로 개별 영화 비교하기

이전 레슨에서 각 열이 서로 다른 장르를 나타내는 영화 DataFrame을 만들었어요. 이제 이 DataFrame의 행들 사이 Jaccard 유사도를 측정해 영화를 서로 비교할 수 있습니다. Jaccard 유사도 점수가 높을수록 두 항목이 더 비슷하다는 뜻이에요.

이번 연습 문제에서는 GoldenEye와 Toy Story를 비교하고, GoldenEye와 SkyFall을 비교한 뒤 결과를 살펴봅니다.

이전 레슨에서 만들었던, 모든 영화를 행으로 두고 장르를 Boolean 열로 둔 movie_cross_table DataFrame이 로드되어 있습니다.

지침 1/3

undefined XP
  • 1
    • sklearn.metrics에서 Jaccard 유사도 점수 함수를 임포트하세요.
  • 2
    • 'GoldenEye'와 'Toy Story'가 있는 행을 numpy 배열로 변환하고 두 영화의 유사도를 측정하세요.
  • 3
    • Skyfall이 있는 행을 numpy 배열로 변환하고 GoldenEye와의 유사도를 측정하세요.