1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶクラスタ分析

Connected

演習

K-means クラスタリング:最初の演習

この演習では、データセットに対する k-means クラスタリングの使い方に慣れていきます。Comic Con のデータセットを使って、k-means クラスタリングがどのように動作するかを確認しましょう。

k-means クラスタリングの2つのステップを思い出してください。

  • kmeans() 関数でクラスタ中心を定義します。必須引数は「観測データ」と「クラスタ数」の2つです。
  • vq() 関数でクラスタラベルを割り当てます。必須引数は「観測データ」と「クラスタ中心」の2つです。

データは pandas の DataFrame comic_con に格納されています。x_scaled と y_scaled は、ある時点での人々の X・Y 座標を標準化した列名です。

指示

100 XP
  • SciPy から kmeans と vq 関数をインポートします。
  • kmeans() 関数でクラスタ数を2としてクラスタ中心を生成します。
  • そのクラスタ中心を使ってクラスタラベルを作成します。