1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonでの金融データのインポートと管理

Connected

演習

世界の所得:代表値

代表値の中で最も一般的なのは、すべての値の合計を値の個数で割った平均(mean)、データを上下二つに分ける中央値(median)、そしてデータ中で最も頻出する最頻値(mode)です。pandas パッケージには、これらを計算する関数が用意されています。

このデータセットでは、'Income per Capita' の値は浮動小数で、重複がありません。そのため、コンソールで income['Income per Capita'].mode() を実行すると空の Series が返ります。ここでは切り捨ての整数除算演算子 // を使って、新しい列を追加し、所得を千単位に丸め下げます。例えば、11,543.43 は 11 になります。次に、これらの関数を実行して、所得の分布をよりよく理解します。

pandas は pd としてインポート済みで、前の演習で作成した income DataFrame がワークスペースにあります。

指示

100 XP
  • 適切な関数を使って、'Income per Capita' の世界全体の平均(mean)を計算します。
  • 適切な関数を使って、'Income per Capita' の世界全体の中央値(median)を計算します。
  • ブロードキャストを用いて、新しい列 'Income per Capita (,000)' を income['Income per Capita'] // 1000 と等しく作成します。そのうえで、この新しい列の最頻値(mode)を適切な関数で計算します。