1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python を使った統計学入門

Connected

演習

IQRを用いて外れ値を見つける

外れ値は、平均値や、分散・標準偏差など平均値に基づく統計量に大きな影響を与えます。四分位範囲(IQR)は、外れ値の影響を受けにくいばらつきの指標であり、外れ値の検出にもよく使われます。値が \(\text{Q1} - 1.5 \times \text{IQR}\) より小さいか、\(\text{Q3} + 1.5 \times \text{IQR}\) より大きい場合、その値は外れ値とみなされます。実際、matplotlib の箱ひげ図のひげの長さもこの方法で計算されています。

中央値、四分位数、外れ値を示す箱ひげ図

この演習では、IQRを計算し、外れ値を見つけます。pandas(pd)と numpy(np)はすでに読み込まれており、food_consumption も利用可能です。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • 国ごとにグループ化し、co2_emission の合計を求めることで、国別のco2_emission の合計を計算しましょう。結果のDataFrameを emissions_by_country として保存してください。