1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 추천 엔진 만들기

Connected

연습 문제

암시적 데이터 vs. 명시적 데이터

영상 연습 문제에서 언급했듯이, 추천 엔진에서 사용하는 피드백은 명시적이거나 암시적일 수 있어요.

데이터셋 listening_history_df가 로드되어 있습니다. 이 데이터셋에는 사용자와 그들이 청취한 곡을 식별하는 열과 함께 다음 정보가 포함되어 있어요:

  • Skipped Track: 사용자가 곡을 건너뛰었는지 끝까지 들었는지를 기록한 Boolean 열입니다.
  • Rating: 사용자가 곡에 매긴 10점 만점의 점수입니다.

이번 연습에서는 데이터를 탐색한 뒤, 어떤 열이 명시적 피드백을 가장 잘 반영하고 어떤 열이 암시적 피드백을 반영하는지 식별해 보겠습니다.

지침 1/2

undefined XP
    1
    2
  • listening_history_df의 처음 5행을 확인하세요.
  • Rating과 Skipped Track 열의 고유값 개수를 출력하세요.
  • Rating 열 값의 히스토그램을 표시하세요.