1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ教師なし学習

Connected

演習

クラスタリングのための魚データのスケーリング

魚の計測値を表す配列 samples が与えられています。各行は1匹の魚に対応します。重さ(グラム)、長さ(センチメートル)、高さと長さの比率(パーセンテージ)など、特徴量ごとにスケールが大きく異なります。このデータを効果的にクラスタリングするには、まずこれらの特徴量を標準化する必要があります。この演習では、標準化とクラスタリングを行うパイプラインを構築します。

この魚の計測データは、Journal of Statistics Education から取得されています。

指示

100 XP
  • 次をインポートします:
    • sklearn.pipeline から make_pipeline。
    • sklearn.preprocessing から StandardScaler。
    • sklearn.cluster から KMeans。
  • StandardScaler のインスタンス scaler を作成します。
  • クラスタ数を 4 にした KMeans のインスタンス kmeans を作成します。
  • scaler と kmeans を連結したパイプライン pipeline を作成します。これには、make_pipeline() にそれらを引数として渡すだけで大丈夫です。