1. Learn
  2. /
  3. 课程
  4. /
  5. Python 工具箱

Connected

道练习

处理带时间戳数据的列表推导式

现在,您将运用本章所学来解决一个简单的数据提取问题。本练习还会向您介绍一种数据结构:pandas 的 Series。此处不做过多展开,但需要您知道的是,在分析 pandas DataFrame 的数据时,您会经常与它打交道。您可以将 DataFrame 的列看作名为 Series 的一维数组。

在本练习中,您将使用列表推导式从带时间戳的 Twitter 数据中提取时间。pandas 包已以 pd 导入,文件 'tweets.csv' 已作为 DataFrame df 导入供您使用。

说明

100 XP
  • 从 df 中提取 'created_at' 列,并将结果赋值给 tweet_time。趣闻:这里 tweet_time 中提取的列是一个 Series 数据结构!
  • 创建一个列表推导式,从 tweet_time 的每一行中提取时间。每一行是一个表示时间戳的字符串,您将访问字符串中的第 12 到 19 个字符 来提取时间。使用 entry 作为 迭代变量,并将结果赋值给 tweet_clock_time。请记住,Python 使用从 0 开始的索引!