1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonでの金融データのインポートと管理

Connected

演習

時価総額上位3つの金融会社のデータを取得する

pd.MultiIndex() オブジェクトは、各行に複数の識別子を持ちます。これにより、複数の企業に対する条件に基づいて一度にデータを取得できます。

この新しいスキルを使って、金融セクターで最も大きな企業の株価を取得してみましょう。DataReader、date、pandas(pd)、matplotlib.pyplot(plt)はすでにインポート済みで、前の演習からの listings DataFrame も用意されています。

指示

100 XP
  • listings のインデックスとして 'Stock Symbol' を設定し、listings_ss に代入します。
  • .loc[] を使って企業セクターが 'Finance' の行をフィルタし、'Market Capitalization' 列を抽出します。.nlargest() を適用して、時価総額が上位3社を top_3_companies に代入します。
  • 結果のインデックスをリストに変換し、top_3_tickers に代入します。
  • date() を使って start を 2015年1月1日に設定します。
  • date() を使って end を 2020年4月1日に設定します。
  • DataReader() を使い、start から end までの期間で、'iex' から top_3_tickers の株価データを取得し、result に代入します。
  • .stack() メソッドを適用して、ティッカーをインデックスに移動し、DataFrame をロング形式に変換します。
  • data から 'close' を選択し、.unstack() を適用します。最後に .info() で、ワイド形式になった結果の DataFrame を確認します。