1. Learn
  2. /
  3. 课程
  4. /
  5. Python 数据清洗

Connected

道练习

重新映射类别

为了更好地了解 airlines 中的问卷受访者,您想要查找某些回答与一周中的具体哪一天以及在登机口等待时间之间是否存在关系。

airlines DataFrame 包含 day 和 wait_min 两列,分别是分类型与数值型。day 列记录航班发生的具体日期,wait_min 记录旅客在登机口等待的分钟数。为便于分析,您希望创建两个新的分类型变量:

  • wait_type:0-60 分钟为 'short',60-180 为 'medium',180+ 为 long
  • day_week:工作日为 'weekday',周末为 'weekend'。

pandas 和 numpy 包已分别以 pd 和 np 导入。现在来创建一些新的分类型数据吧!

说明

100 XP
  • 按描述为 wait_type 列创建区间与对应标签。
  • 使用 pd.cut() 基于 wait_min 创建 wait_type 列,并将 label_ranges 与 label_names 传入正确的参数位置。
  • 创建 mapping 字典,将工作日映射为 'weekday',将周末映射为 'weekend'。
  • 使用 .replace() 创建 day_week 列。