1. Learn
  2. /
  3. 课程
  4. /
  5. Python 数据清洗

Connected

道练习

查找一致性

在本练习以及整章中,您将使用 airlines 数据帧,其中包含来自航空公司客户对旧金山机场的调查问卷回复。

该数据帧包含航班元数据,如航空公司、目的地、等待时间,以及关于清洁度、安全性和满意度等关键问题的回答。另一个名为 categories 的数据帧也已创建,包含各个问卷列所有可能的正确取值。

在本练习中,您将同时使用这两个数据帧,找出取值不一致的问卷答案并将其删除,本质上就是对这两个数据帧执行视频练习中演示的外连接与内连接。pandas 库已按 pd 导入,airlines 和 categories 数据帧已在您的环境中。

说明 1 / 共 4 个

undefined XP
    1
    2
    3
    4
  • 打印 categories 数据帧,仔细查看各个问卷列所有可能的正确类别。
  • 使用 .unique() 方法打印 airlines 中问卷列的唯一取值。