1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶマーケットバスケット分析

Connected

演習

複数メトリクスでの高度なフィルタリング

これまでに、オンラインのノベルティギフトストアのデータを使って、特定の被説明項(consequent)を促進するために利用できる説明項(antecedent)を探しました。候補となるルールが非常に多かったため、Apriori アルゴリズムと複数メトリクスでのフィルタリングに頼って絞り込みました。この演習では、特定の説明項に狙いを定めるのではなく、ルールの全体集合を確認し、有用なものを見つけます。

データはすでに読み込み・前処理・ワンホットエンコード済みで、onehot として利用可能です。さらに、mlxtend から apriori() と association_rules() がインポートされています。この演習では、Apriori アルゴリズムを適用して頻出アイテム集合を特定します。続いて、そのアイテム集合からアソシエーションルールを生成し、複数メトリクスでフィルタリングします。

指示

100 XP
  • ワンホットエンコード済みのアイテム集合に Apriori アルゴリズムを適用し、最小サポートしきい値を 0.001 に設定してください。
  • 最小サポートしきい値 0.001 を用いてアソシエーションルールを抽出してください。
  • antecedent_support を 0.002、consequent_support を 0.01 に設定してください。
  • confidence を 0.60 より大きく、lift を 2.50 より大きく設定してください。