1. Learn
  2. /
  3. 课程
  4. /
  5. Python 中的机器学习特征工程

Connected

道练习

标准化(Standardization)

归一化在把一列数据缩放到两个边界之间时很有用,但是如果其中任意一列受异常值影响过大,就很难将两列缩放后的数据进行比较。一个常用的解决方案是标准化:不再设置严格的上、下界,而是将数据以其均值为中心,并计算每个数据点相对于均值的标准差数量(即 z 分数)。

说明

100 XP
  • 从 sklearn 的 preprocessing 模块中导入 StandardScaler。
  • 将 StandardScaler() 实例化为 SS_scaler。
  • 在 so_numeric_df 的 Age 列上拟合 StandardScaler。
  • 使用刚刚拟合的缩放器转换同一列。