1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonでの金融データのインポートと管理

Connected

演習

世界の所得分布のデシル

デシル (decile) とは、あるデータセットの分布を10等分することで得られる特別な種類の分位点です。デシル(および他の種類の分位点)を作るには、次の numpy 関数を .quantile() に渡します。ここで、start は区間の開始値(含む)、stop は区間の終了値(含まない)、step は隣接する値の間隔です。

np.arange(start, stop, step)

動画で見たように、標準的な棒グラフはデータの分布を視覚化するのに最適です。.plot() に引数として kind='bar' を追加すると作成できます。

では、この知識を使ってデシルで所得分布の要約をプロットしてみましょう。pandas は pd、numpy は np、matplotlib.pyplot は plt としてインポート済みで、前の演習で使った income DataFrame もワークスペースに用意されています。

指示

100 XP
  • np.arange() を使って 10% から 90% までを 10% 刻みで生成し、結果を quantiles に代入して出力します。
  • quantiles と .quantile() を使って、一人当たり所得のデシルを deciles として計算し、結果を出力します。
  • 結果を棒グラフでプロットして表示し、plt.tight_layout() を適用します。タイトルは 'Global Income per Capita - Deciles' とします。