標準化スケーリング

標準化スケーリングは、数値特徴量の平均を0、分散を1に変換します。この演習では、sklearn の StandardScaler() を使って標準化を行います。まず、数値列のフィルタリングと列に関する知識を組み合わせて、スケーリングを適用する対象列だけを選択します。このフィルタリングはすでに用意されており、部分一致を可能にする正規表現を使って実行されます。次に、fit_transform() を使って対象の列を変換します。

pandas モジュールはワークスペースで pd として利用可能で、サンプルの DataFrame は df に読み込まれています。さらに、hour 列はすでに datetime に変換済みで、sklearn.preprocessing から StandardScaler も利用できます。