1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ次元削減

Connected

演習

分散の小さい特徴量

前の演習で、正規化後の head_df に対して分散の小さい特徴量を除外するしきい値として 0.001 が適切だと分かりました。今回は VarianceThreshold の特徴選択器を使って、これらの特徴量を削除しましょう。

指示

100 XP
  • しきい値 0.001 で分散しきい値セレクターを作成します。
  • head_df を各列の平均で割って正規化し、セレクターに対して fit します。
  • .get_support() を使ってセレクターからブールマスクを作成します。
  • .loc[] メソッドにそのマスクを渡して、次元削減した DataFrame を作成します。