1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ統計入門

Connected

Exercises

IQR を使って外れ値を見つける

外れ値は平均のような統計量や、平均に依存する分散・標準偏差といった統計量に大きな影響を与えます。四分位範囲(Interquartile Range; IQR)は、外れ値の影響を受けにくい散らばりの尺度です。IQR は外れ値の検出にもよく使われ、値が \(\text{Q1} - 1.5 \times \text{IQR}\) より小さい、または \(\text{Q3} + 1.5 \times \text{IQR}\) より大きい場合、その値は外れ値とみなされます。実際、matplotlib の箱ひげ図における「ひげ」の長さはこの方法で計算されます。

Diagram of a box plot showing median, quartiles, and outliers

この演習では、IQR を計算し、それを使って外れ値を見つけます。pandas は pd、numpy は np として読み込まれており、food_consumption が利用可能です。

คำแนะนำ 1 / 4

undefined XP
    1
    2
    3
    4
  • 国ごとにグループ化し、co2_emission の合計をとって、国別の合計 co2_emission を計算します。結果の DataFrame を emissions_by_country として保存してください。