1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶカスタマーセグメンテーション

Connected

연습 문제

二乗誤差の合計(SSE)を計算する

この演習では、クラスター数を1から15まで変化させながら、二乗誤差の合計(SSE)を計算します。ここでは、ひじ(elbow)をより読み取りやすくするために、カスタム作成したデータセットを使用します。

正規化済みデータは data_normalized として読み込まれています。scikit-learn の KMeans モジュールはすでにインポート済みです。また、SSEを格納する空の辞書 sse = {} を初期化しています。

コンソールでデータを自由に確認してかまいません。

지침

100 XP
  • KMeans を学習し、k を1から15の範囲で変化させて各 k の SSE を計算します。
  • KMeans はクラスター数を k、乱数シードを 1 で初期化します。
  • 正規化済みデータセットに対して KMeans を適合させます。
  • 二乗距離の合計を sse 辞書のキー k に代入します。