1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶクラスタ分析

Connected

演習

均一なクラスタリングパターン

シードの影響に慣れてきたところで、k-means クラスタリングが均一なクラスタを作りやすいというバイアスについて見ていきましょう。

次の演習では、マウス型のデータセットを使います。マウス型のデータセットとは、マウスの頭部に似た点群のことで、顔と左右の耳に相当する3つの円形のクラスタから構成されます。

こちらが典型的なマウス型データセットの例です(出典)。

データは pandas の DataFrame mouse に格納されています。x_scaled と y_scaled は、各データ点の標準化済み X 座標と Y 座標の列名です。

指示

100 XP
  • SciPy から kmeans と vq 関数をインポートします。
  • kmeans() 関数でクラスタ数を3としてクラスタ中心を生成します。
  • 上で生成したクラスタ中心を使って vq() でクラスタラベルを作成します。