1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Market Basket Analysis

Connected

연습 문제

승산비로 더 정교하게 보기

이번에도 도서관에 결과를 보고했어요: 신뢰도(confidence) 지표가 더 높으니, Twilight을 활용해 Harry Potter를 추천하자고 제안했죠. 도서관은 제안에 고마워하면서도, 다른 지표를 사용해 이 관계가 정말 의미 있는지 확인해 달라고 요청합니다.

여기서는 승산비(lift)가 유용할 수 있음을 떠올립니다. 승산비가 1보다 작다면, Harry Potter와 Twilight의 동시 발생이 무작위로 짝지어졌다고 가정했을 때 기대되는 빈도보다 더 드물게 함께 나타난다는 뜻이에요. 앞선 두 연습 문제와 마찬가지로, DataFrame books가 이미 불러와져 있고, numpy는 np라는 별칭으로 임포트되어 있어요.

지침

100 XP
  • {Potter, Twilight}의 지지도를 계산하세요.
  • {Potter}의 지지도를 계산하세요.
  • {Twilight}의 지지도를 계산하세요.
  • {Potter} \(\rightarrow\) {Twilight}의 승산비를 계산하세요.