1. Learn
  2. /
  3. 课程
  4. /
  5. Python 数据清洗

Connected

道练习

字符串相加与数字拼接

在上一个练习中,您已经确认 user_type 的正确数据类型是 category,并完成了转换,从而提取出能反映 user_type 分布的统计摘要。

另一个常见的数据类型问题是:本应为数值的字段被导入为字符串,此时执行求和、乘法等数学运算会得到字符串拼接的结果,而不是数值运算的输出。

在本练习中,您将把字符串列 duration 转换为 int 类型。在此之前,需先从该列中去掉 "minutes",以确保 pandas 将其识别为数值。pandas 包已以 pd 导入。

说明

100 XP
  • 使用 .strip() 方法从 duration 中去掉 "minutes",并将结果存入 duration_trim 列。
  • 将 duration_trim 转换为 int,并将结果存入 duration_time 列。
  • 编写一个 assert 语句,检查 duration_time 的数据类型是否为 int。
  • 打印平均骑行时长。