1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Market Basket Analysis

Connected

연습 문제

lift로 가지치기

이번에도 기념품 상점 매니저에게 보고해요. 이번에는 Apriori 알고리즘의 support 임계값을 높였을 때는 규칙이 전혀 나오지 않았고, 낮췄을 때는 규칙이 두 개만 나왔다고 설명해요. 매니저는 수고했다고 칭찬하면서, 이 두 규칙을 하나로 줄이기 위해 다른 지표를 써보길 제안해요.

lift의 해석이 단순하다는 것을 기억해요. 값이 1보다 크면, 거래에서 항목들이 서로 독립적으로 나타난다고 가정했을 때 기대되는 것보다 더 자주 함께 나타난다는 뜻이에요. 메시지를 전달하기 쉽기 때문에 lift를 사용하기로 해요. pandas는 pd로, 원-핫 인코딩된 거래 데이터는 onehot으로 제공돼요. 또한 mlxtend에서 apriori는 이미 임포트되어 있어요.

지침

100 XP
  • mlxtend에서 association_rules 함수를 임포트하세요.
  • support를 0.001로, 최대 아이템셋 길이를 2로 설정해 빈발 아이템셋을 계산하세요.
  • lift가 최소 1.0이 되도록 필터링하는 구문을 완성하세요.
  • 규칙 DataFrame을 출력하세요.