1. Учиться
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Market Basket Analysis

Connected

Exercise

지지 임계값 선택하기

온라인 기프트 스토어의 매니저가 이전 연습 문제에서 제공한 결과를 보고 잘했다고 칭찬합니다. 하지만 한 가지를 지적합니다. 식별한 모든 아이템셋에 아이템이 하나만 포함되어 있다는 점입니다. 더 느슨한 규칙을 사용해 더 많은 아이템셋, 가능하다면 여러 아이템이 포함된 아이템셋도 생성할 수 있는지 묻습니다.

이에 동의한 뒤, 왜 1개 초과 아이템을 가진 아이템셋이 없었는지 생각해 봅니다. max_len 매개변수 때문은 아닙니다. 세 개로 설정되어 있었기 때문이죠. 원인은 지지도(support)라고 판단하고, 서로 다른 두 값을 시험해 보며 각 경우에 추가로 생성되는 아이템셋의 개수를 확인하기로 합니다. pandas는 pd로, 원-핫 인코딩된 데이터는 onehot으로 제공됩니다.

Инструкции 1 / 2

undefined XP
    1
    2
  • apriori 알고리즘에 대한 import 문을 완성하세요.
  • frequent_itemsets_1에는 최소 지지도를 0.003, 최대 길이를 3으로 설정하세요.
  • frequent_itemsets_2에는 최소 지지도를 0.001, 최대 길이를 3으로 설정하세요.