1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶクラスタ分析

Connected

演習

クラスタの基本チェック

FIFA 18 のデータセットでは、これまでの演習で主にディフェンダーに注目してきました。ここでは選手の攻撃的な属性に目を向けてみましょう。Pace(pac)、Dribbling(dri)、Shooting(sho)は、攻撃的な選手に見られる特徴量です。この演習では、これら3つの属性のスケーリング済み値を使って、すでに k-means クラスタリングを実行しています。作成されたクラスタに対して、いくつか基本的な確認を行ってみましょう。

データは pandas の DataFrame fifa に格納されています。スケーリング済みの列名はリスト scaled_features にあります。クラスタラベルは cluster_labels 列に保存されています。pandas の .count() と .mean() メソッドを使うと、DataFrame 内の観測数と平均を求められることを思い出してください。

指示

100 XP
  • 列 cluster_labels でグループ化して、各クラスタのサイズを表示します。
  • 各クラスタに属する選手の賃金の平均値を表示します。ユーロ建ての賃金は eur_wage 列に格納されています。