1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySparkで学ぶ特徴量エンジニアリング

Connected

演習

スケーラーをスケールする

前の演習では、単一の変数に対して最小最大スケーリングを行いました。スケールすべき変数が大量にある場合、各列ごとに何百行ものコードは書きたくありませんよね。前の演習を発展させて、関数化してみましょう。

指示

100 XP
  • min_max_scaler という関数を定義し、引数としてデータフレーム df と、スケール対象の列名リスト cols_to_scale を取ります。
  • for ループでリスト内の各列を反復処理し、最小最大スケーリングを適用します。
  • 新しい列が追加されたデータフレーム df を返します。
  • 関数 min_max_scaler() を df と列リスト cols_to_scale に適用します。