1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Market Basket Analysis

Connected

Exercises

산점도로 가지치기(pruning)하기

이전 연습 문제에서 제출한 배트맨 중심 스트리밍 서비스 제안을 본 뒤, 창업자는 초기 계획이 너무 좁았을 수 있다고 깨달았어요. 특정 시작 타이틀에 집중하기보다, 이제는 연관 규칙의 전반적인 패턴에 주목하고 그에 따라 가지치기를 수행해 달라고 요청합니다. 목표는 강한 연관성을 다수 식별하는 것이에요.

다행히 방금 산점도 만드는 방법을 배웠죠. 많은 공통 지표에서 최적 규칙이 confidence-support 경계에 위치하므로, support와 confidence를 그리는 것부터 시작하기로 합니다. 원-핫 인코딩된 데이터는 이미 onehot으로 불러와져 있어요. 또한 apriori()와 association_rules()가 임포트되어 있으며, pandas는 pd로 사용할 수 있어요.

คำแนะนำ

100 XP
  • 최소 support를 0.0075로, 최대 길이를 2로 설정하여 2개 아이템으로 구성된 아이템셋을 대량으로 생성하세요.
  • 추가 필터링을 피하도록 association_rules() 구문을 완성하세요.
  • 산점도를 생성하는 구문을 완성하고, y 변수는 confidence를 사용하도록 설정하세요.