1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶマーケットバスケット分析

Connected

演習

support-confidence 境界の最適性

前の演習で作成した散布図を創業者に見せ、剪定を使って support-confidence 境界を再現しましょうかと提案します。Bayardo-Agrawal の結果について説明しましたが、彼女は半信半疑の様子で、例で示せないかと尋ねます。

散布図では第3の指標に応じて点の大きさを変えられることを思い出し、これを使って support-confidence 境界の最適性を示すことにします。Bayardo-Agrawal が適用した指標の1つである lift を用いて点の大きさをスケーリングして示します。ワンホットエンコード済みデータは onehot として読み込まれています。さらに、apriori() と association_rules() はインポート済みで、pandas は pd として利用できます。

指示

100 XP
  • DataFrame onehot に Apriori アルゴリズムを適用します。
  • support 指標と最小しきい値 0.0 を使ってアソシエーションルールを計算します。
  • 散布図の式を完成させ、点の大きさが lift でスケーリングされるようにします。