1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Market Basket Analysis

Connected

연습 문제

지지도-신뢰도 경계의 최적성

이전 연습 문제에서 만든 산점도를 가지고 창업자를 다시 찾아가, 가지치기를 사용해 지지도-신뢰도 경계를 복원하는 것이 좋을지 묻습니다. Bayardo-Agrawal의 결과에 대해 설명했지만, 창업자는 회의적이라 예시로 보여줄 수 있겠냐고 합니다.

산점도에서 점의 크기를 세 번째 지표로 스케일링할 수 있다는 점을 떠올리며, 이를 활용해 지지도-신뢰도 경계의 최적성을 보여주기로 합니다. Bayardo-Agrawal이 적용한 지표 중 하나인 lift를 사용해 점 크기를 스케일링하여 이를 시연할 거예요. 원-핫 인코딩된 데이터는 onehot으로 불러와져 있고, apriori()와 association_rules()가 임포트되어 있으며, pandas는 pd로 사용할 수 있어요.

지침

100 XP
  • DataFrame onehot에 Apriori 알고리즘을 적용하세요.
  • support 지표와 최소 임계값 0.0을 사용해 연관 규칙을 계산하세요.
  • 산점도 표현식을 완성해 점의 크기가 lift로 스케일링되도록 하세요.