チャンクごとのデータ処理 (1)

ときどき、データソースが非常に大きく、データセット全体をメモリに保持するのが負荷になりすぎる場合があります。そこでこの演習では、ファイルの最初の1000行を1行ずつ処理し、データセット中のある列に各国名が何回出現するかを数える辞書を作成します。

csv ファイル 'world_dev_ind.csv' は作業ディレクトリに用意されています。はじめに、コンテキストマネージャーと呼ばれる仕組みを使って、このファイルへの接続を開く必要があります。たとえば、with open('datacamp.csv') as datacamp というコマンドは、csv ファイル 'datacamp.csv' をコンテキストマネージャー内で datacamp という名前に束縛します。ここで、with 文がコンテキストマネージャーであり、ファイル接続を開く際にリソースが効率よく確保・解放されるようにする役割があります。