1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python ツールボックス

Connected

exercise

データをチャンクで読み込むイテレータを書く (1)

メモリに収まりきらない大きなデータをチャンクに分けて読み込む別の方法は、ファイルを一定行数(たとえば 100 行)の DataFrame として順に読み込むことです。たとえば、pandas(pd としてインポート)では pd.read_csv(filename, chunksize=100) と書けます。これは反復可能な「リーダーオブジェクト」を作成し、next() を使って順に取り出せます。

この演習では、read_csv() を使って小さな DataFrame のチャンクでファイルを読み込みます。カレントディレクトリにある世界銀行インディケータのデータ 'ind_pop.csv' を使い、複数の国と年にわたる都市人口の指標を見ていきます。

Instruktioner

100 XP
  • pd.read_csv() を使って、サイズ 10 のチャンクで 'ind_pop.csv' を読み込み、結果を df_reader に代入します。
  • df_reader から最初の 2 チャンクを表示します。