1. Learn
  2. /
  3. 课程
  4. /
  5. Python 金融机器学习

Connected

道练习

创建按星期几的特征

我们可以构造日期时间特征,为非线性模型提供更多信息。大多数金融数据都带有日期时间信息,其中包含大量内容——年份、月份、日期,有时还有小时、分钟和秒。此外,我们还可以得到星期几、季度,或自某事件(例如财报发布)以来的经过时间。

这里我们只提取星期几,因为我们的数据集回溯时间不长。pandas 的日期时间索引中的 dayofweek 属性可以帮助我们得到星期几。然后,我们用 pandas 的 get_dummies() 对 dayofweek 做哑变量处理。这样会为每个星期几创建一列,取二元值(0 或 1)。我们会丢弃第一列,因为它可以由其他列推断出来。

说明

100 XP
  • 使用 lng_df 索引中的 dayofweek 属性获取星期几。
  • 对该星期几变量使用 get_dummies 函数,并设置前缀为 'weekday'。
  • 将 days_of_week 变量的索引设为与 lng_df 的索引相同,以便合并二者。
  • 将 lng_df 和 days_of_week 两个 DataFrame 连接为一个 DataFrame。