1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Market Basket Analysis

Connected

연습 문제

아이템셋 지지도 시각화

한 콘텐츠 스트리밍 스타트업이 컨설팅을 의뢰했습니다. 이들은 라이선스 비용을 낮추기 위해 동일한 시청자층에게 고르게 매력적인 영화만 추려서 좁은 라이브러리를 구성하려고 합니다. 업계의 대형 서비스보다 선택지는 적지만, 더 낮은 구독료를 제공할 수 있죠.

이 프로젝트에서는 MovieLens 데이터를 활용해 히트맵을 그리기로 했습니다. 간단한 지지도 기반 히트맵을 사용하면 다른 제목들과 함께 자주 등장하는 개별 작품을 식별할 수 있습니다. 원-핫 인코딩된 데이터는 DataFrame onehot으로 제공됩니다. 또한 pandas는 pd, seaborn은 sns로 사용할 수 있으며, apriori()와 association_rules()는 이미 임포트되어 있습니다.

지침 1/2

undefined XP
    1
    2
  • 최소 지지도를 0.07로 설정해 빈발 아이템셋을 계산하세요.
  • 연관 규칙을 계산하고 규칙에 대한 가지치기는 적용하지 마세요.