1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ教師なし学習

Connected

演習

PCA特徴量の分散

この魚のデータセットは6次元です。では、その本質的(intrinsic)な次元はいくつでしょうか? PCAの特徴量の分散をプロットして確かめましょう。これまでと同様に、samples は各行が1匹の魚を表す2次元配列です。まず特徴量を標準化する必要があります。

指示

100 XP
  • StandardScaler のインスタンスを作成し、scaler という名前を付けます。
  • PCA のインスタンスを作成し、pca という名前を付けます。
  • make_pipeline() 関数を使って、scaler と pca を連結したパイプラインを作成します。
  • pipeline の .fit() メソッドで、魚のサンプル samples に適合させます。
  • pca の .n_components_ 属性を使って使用された成分数を取り出し、これを range() に渡して features として保存します。
  • plt.bar() を使って説明分散をプロットします。x軸に features、y軸に pca.explained_variance_ を指定します。