1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶマーケティングのための機械学習

Connected

演習

NMF セグメンテーションの平均値

最後に、NMF で作成した 3 セグメント解の平均値を可視化して、K-means の結果と比較できるようにします。ここでは特徴量行列 W を抽出し、各顧客についてこの行列内で最も値が大きい列(セグメント)を選ぶことで、ハードなセグメント割り当てを行います。

pandas ライブラリは pd、seaborn ライブラリは sns として読み込んであります。生データの wholesale データセットはインポート済みで、学習済みの 3 セグメントの NMF インスタンスは nmf として用意されています。components データセットは pandas の DataFrame として読み込んであります。

指示

100 XP
  • 変換後の値をデータに、components のインデックスを列名に渡して、W 行列を作成します。
  • 各行で値が最大になる列名を選び、その列名でセグメントを割り当てます。
  • セグメントごとに各列の平均値を計算します。
  • 平均値をヒートマップで可視化します。