1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶマーケティングのための機械学習

Connected

演習

k-means クラスタリングでセグメンテーションを構築する

この演習では、KMeans アルゴリズムを使って顧客セグメンテーションを構築します。前のステップで確認したとおり、数学的に最適なクラスタ数は 3 から 4 のあたりでした。ここでは、4 セグメントで構築します。

前処理済みデータセットは wholesale_scaled_df として読み込まれています。これを使って KMeans アルゴリズムを実行します。未加工の生データセットは wholesale として用意されており、後で作成した 4 セグメントごとの列の平均値を確認するのに使います。

指示

100 XP
  • sklearn.cluster モジュールから KMeans アルゴリズムをインポートします。
  • クラスタ数を 4、random_state を 123 に設定して KMeans を初期化します。
  • 前処理済みの wholesale_scaled_df データセットでモデルを学習(fit)します。
  • 生成されたラベルを生データの wholesale に新しい列 segment として割り当てます