1. 学习
  2. /
  3. 课程
  4. /
  5. Python 统计学入门

Connected

练习

使用 IQR 查找离群值

离群值会对均值等统计量产生很大影响,也会影响依赖均值的统计量,如方差和标准差。四分位距(Interquartile Range,IQR)是另一种度量离散程度的方法,受离群值影响较小。IQR 也常用于识别离群值:如果某个数值小于 \(\text{Q1} - 1.5 \times \text{IQR}\) 或大于 $\text{Q3} + 1.5 \times \text{IQR}$,就被视为离群值。实际上,matplotlib 箱线图中的"须"的长度就是这样计算的。

Diagram of a box plot showing median, quartiles, and outliers

在本练习中,您将计算 IQR,并用它来找出一些离群值。已加载 pandas 为 pd 和 numpy 为 np,并提供了 food_consumption。

说明 1 / 共 4 个

undefined XP
    1
    2
    3
    4
  • 按国家分组并对 co2_emission 求和,计算每个国家的总 co2_emission。将结果 DataFrame 存为 emissions_by_country。