1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python で学ぶマーケットバスケット分析

Connected

exercise

アイテムセットのサポートを可視化する

あるコンテンツ配信系スタートアップからコンサルティングの依頼がありました。ライセンス料を抑えるために、同じ視聴者層に強く訴求する映画だけを集めた、狭めのライブラリを作りたいと考えています。業界の大手と比べて作品数は少なくなりますが、その分、低価格のサブスクリプションを提供できる見込みです。

このプロジェクトでは、MovieLens データとヒートマップを使うことにしました。シンプルにサポートに基づくヒートマップを使えば、他のタイトルと一緒に選ばれやすい(サポートが高い)個々のタイトルを見つけられます。ワンホットエンコード済みのデータは DataFrame onehot として用意されています。さらに、pandas は pd、seaborn は sns として利用可能で、apriori() と association_rules() はすでにインポート済みです。

Instruktioner 1 / 2

undefined XP
    1
    2
  • 最小サポート 0.07 で頻出アイテムセットを計算します。
  • アソシエーションルールを計算し、プルーニングは行いません。