1. 学习
  2. /
  3. 课程
  4. /
  5. Python 中的探索性数据分析

Connected

练习

移除离群值

虽然并非所有情况下都要移除离群值,但在本次分析中,您决定只保留 "Price" 不属于离群值的航班。

因此,您需要先找到上阈值,然后用它从 planes DataFrame 中移除高于该值的记录。

pandas 已以 pd 导入,seaborn 已以 sns 导入。

说明 1/4

undefined XP
  • 1
    • 分别求第 75 个和第 25 个百分位数,并分别保存为 price_seventy_fifth 和 price_twenty_fifth。
  • 2
    • 计算 IQR,并将其保存为 prices_iqr。
  • 3
    • 计算离群值的上、下阈值。
  • 4
    • 从 planes 中移除离群值。