1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandasで効率よくデータを取り込む

Connected

演習

ファイルを分割して読み込む

大きなファイルを扱うときは、データを分割して読み込み・処理すると楽になります。ここでは、Vermont の税データでこのワークフローを練習しましょう。

最初の500行は vt_data_first500 として読み込まれています。次の500行を取得してください。そのために、正しいレコードを取得する nrows と skiprows、データに列名がないことを pandas に伝える header、不足している列名を与える names といったキーワード引数を使います。また、vt_data_first500 から列名を再利用するため、list() 関数で列名を取得するとよいでしょう。

pandas は pd としてインポート済みです。

指示

100 XP
  • nrows と skiprows を使って、次の500行からなるデータフレーム vt_data_next500 を作成します。
  • header 引数を設定して、ヘッダー行がないことを pandas に知らせます。
  • names 引数に vt_data_first500 の列名リストを渡して、vt_data_next500 の列名を設定します。