1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶデータプライバシーと匿名化

Connected

演習

顧客のセグメンテーション

この演習では、差分プライバシー対応のクラスタリングモデルを使って、Mall Customer Segmentation Dataset から顧客セグメンテーションを行います。

K-means クラスタリングでは、エルボー法で最適なクラスタ数を求めることができます。

非プライベートモデルでのエルボー法の結果グラフ
このグラフから、最適なクラスタ数は 5 であることがわかります。読み込まれている X の Annual Income と Spending Score に基づいてクラスタリングし、結果を可視化します。

完全なデータセットは mall_df として読み込まれています。クラスタを描画するためのカスタム関数 show_clusters() も用意しています。詳しくは ?show_clusters で確認してください。

指示1 / 3

undefined XP
    1
    2
    3
  • 5 クラスタでプライベートなクラスタリングモデルを初期化します。