1. Learn
  2. /
  3. Courses
  4. /
  5. Python ツールボックス

Connected

Exercise

チャンクごとのデータ処理 (1)

ときどき、データソースが非常に大きく、データセット全体をメモリに保持するのが負荷になりすぎる場合があります。そこでこの演習では、ファイルの最初の1000行を1行ずつ処理し、データセット中のある列に各国名が何回出現するかを数える辞書を作成します。

csv ファイル 'world_dev_ind.csv' は作業ディレクトリに用意されています。はじめに、コンテキストマネージャーと呼ばれる仕組みを使って、このファイルへの接続を開く必要があります。たとえば、with open('datacamp.csv') as datacamp というコマンドは、csv ファイル 'datacamp.csv' をコンテキストマネージャー内で datacamp という名前に束縛します。ここで、with 文がコンテキストマネージャーであり、ファイル接続を開く際にリソースが効率よく確保・解放されるようにする役割があります。

コンテキストマネージャーの詳細を学びたい場合は、DataCamp の「Importing Data in Python」コースをご覧ください。

Instructions

100 XP
  • open() を使って、csv ファイル 'world_dev_ind.csv' をコンテキストマネージャー内で file に束縛してください。
  • for ループを完成させ、ループ本体が 1000 回反復されるようにして、ファイルの最初の1000行だけを処理してください。