1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶDaskによる並列プログラミング

Connected

Exercise

Spotify の楽曲を分析する

Spotify の楽曲カタログを調べるために、集計したい複数の CSV ファイルがあります。重要なのは、できるだけ速く処理し、利用可能な計算リソースを最大限に活用することです。

各 CSV ファイルには、ある年にリリースされたすべての曲が含まれており、各行が個々の曲の情報を表します。

dask と delayed() はすでにインポート済みで、ファイル名のリストは filenames として環境に用意されています。pandas は pd としてインポートされています。

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • 各ファイルを DataFrame として読み込むために、pd.read_csv() 関数の遅延版を使ってください。