1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonでの金融データのインポートと管理

Connected

演習

複数のExcelワークシートからのデータ読み込みと結合を自動化する

これで、forループを使って、Excelファイル listings.xlsx にある3つの取引所すべての上場情報のインポート処理を自動化できるようになりました。次の手順で進めます。

  1. pd.ExcelFile() オブジェクトの sheet_names 属性を使ってシート名を取得します。
  2. 空のリストを作成します。
  3. 取得したシート名をforループで走査し、対応するシートからExcelファイルのデータを読み込んで変数に格納します。必要に応じて参照用の列を追加します。各イテレーションで、この変数の中身をリストに追加します。
  4. リスト内のDataFrameを連結します。

必要であれば、この章のこれまでの演習や pandas のドキュメントを参照してください。pandas は pd としてインポート済みです。

指示

100 XP
  • ファイル listings.xlsx を使って pd.ExcelFile() オブジェクトを作成し、変数 xls に代入します。
  • xls の .sheet_names 属性からシート名を取得し、exchanges に代入します。
  • 空のリストを作成し、変数 listings に代入します。
  • forループで exchanges を exchange を反復変数として走査します。各イテレーションで以下を行います。
    • 欠損値対応として na_values に 'n/a' を指定し、データソースに xls、sheet_name 引数に exchange を指定して pd.read_excel() を使います。結果を listing に代入します。
    • listing に新しい列 'Exchange' を作成し、値として exchange(反復変数)を設定します。
    • 得られた listing DataFrame を listings に追加します。
  • pd.concat() を使って listings の中身を連結し、listing_data に代入します。
  • .info() を使って listing_data の内容を確認します。