1. 学ぶ
  2. /
  3. コース
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

演習

標準化スケーリング

標準化スケーリングは、数値特徴量の平均を0、分散を1に変換します。この演習では、sklearn の StandardScaler() を使って標準化を行います。まず、数値列のフィルタリングと列に関する知識を組み合わせて、スケーリングを適用する対象列だけを選択します。このフィルタリングはすでに用意されており、部分一致を可能にする正規表現を使って実行されます。次に、fit_transform() を使って対象の列を変換します。

pandas モジュールはワークスペースで pd として利用可能で、サンプルの DataFrame は df に読み込まれています。さらに、hour 列はすでに datetime に変換済みで、sklearn.preprocessing から StandardScaler も利用できます。

指示

100 XP
  • 数値列を選択し、与えられた filter_cols を .select_dtypes() を使ってフィルタリングします。
  • StandardScaler() を作成し、.fit_transform() を使って対象列に標準化スケーリングを適用します。
  • 変換後の新しい列の分散を .var() で出力します。