k-means クラスタリングでセグメンテーションを構築する

この演習では、KMeans アルゴリズムを使って顧客セグメンテーションを構築します。前のステップで確認したとおり、数学的に最適なクラスタ数は 3 から 4 のあたりでした。ここでは、4 セグメントで構築します。

前処理済みデータセットは wholesale_scaled_df として読み込まれています。これを使って KMeans アルゴリズムを実行します。未加工の生データセットは wholesale として用意されており、後で作成した 4 セグメントごとの列の平均値を確認するのに使います。