1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonでの金融データのインポートと管理

Connected

演習

セクターとIPO年ごとに複数の指標を計算する

seaborn の pointplot() 関数は、数値変数の要約統計量を、カテゴリ変数の異なるレベル間で比較するのに役立ちます。

seaborn.pointplot(x=None, y=None, hue=None, data=None, ...)

動画では、時価総額(数値変数)を、IPO(カテゴリ変数)が2000年より前(第1のレベル)か2000年以降(第2のレベル)かで分けて可視化しました。

この演習では、NYSE と NASDAQ について、2000年以降の各年の平均時価総額を、95パーセンタイルを超える外れ値を除外したうえで比較します。pandas は pd、matplotlib.pyplot は plt としてインポート済みで、参照列 'Exchange' を持つ listings DataFrame がワークスペースに用意されています。

指示

100 XP
  • seaborn を sns としてインポートします。
  • すべての取引所のうち、'amex' を除外し、IPO が2000年以降の企業だけに listings をフィルタリングします。
  • 列 'IPO Year' のデータを整数に変換します。
  • 時価総額を百万USD単位で表す列 market_cap_m を作成します。
  • market_cap_m について、95パーセンタイルを超える値を除外します。
  • listings に対して pointplot を作成し、x に列 'IPO Year'、y に 'market_cap_m'、hue に 'Exchange' を指定します。xticks を45度回転させてから結果を表示します。