1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandas で学ぶデータ操作

Connected

演習

効率的な要約統計

pandas や NumPy には多くの関数がありますが、データを要約するのに別の関数が必要になることもあります。

.agg() メソッドを使うと、独自に用意した関数を DataFrame に適用できるほか、複数列に一度に関数を適用できるので、集約処理をとても効率よく行えます。たとえば、

df['column'].agg(function)

この演習で使うカスタム関数では、"IQR" は四分位範囲(第75パーセンタイルから第25パーセンタイルを引いた値)を表します。外れ値を含むデータに対して有用な、標準偏差の代替指標です。

sales が利用可能で、pandas は pd として読み込まれています。

指示1 / 3

undefined XP
  • 1
    • 用意されたカスタム関数 iqr と .agg() を使って、sales の temperature_c 列の IQR を出力してください。
  • 2
    • 列の選択を更新し、カスタム関数 iqr を .agg() と一緒に使って、temperature_c、fuel_price_usd_per_l、unemployment の順に IQR を出力してください。
  • 3
    • .agg() で呼び出す集約関数を更新し、iqr と "median" をこの順で含めてください。