1. 学习
  2. /
  3. 课程
  4. /
  5. Python 中的机器学习预处理

Connected

练习

确定需要标准化的特征

在本练习中,您将查看 UFO 数据集各列的方差,以判断哪些特征需要标准化。观察 seconds 和 minutes 两列的方差后,您会发现 seconds 列的方差非常高。由于 seconds 与 minutes 彼此相关(我们在进行建模特征选择时会处理这一问题),现在先对 seconds 列进行对数归一化。

说明

100 XP
  • 计算 seconds 和 minutes 两列的方差,并仔细查看结果。
  • 对 seconds 列执行对数归一化,生成名为 seconds_log 的新列。
  • 打印 seconds_log 列的方差。