1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶDaskによる並列プログラミング

Connected

연습 문제

CSVからDask DataFrameを作成する

これまでに、ループとdelayed関数を使ってSpotifyの楽曲データを分析しました。今では、Dask DataFrameを使えば同じことをより簡単に実現できるとわかりました。ここでは、ループの代わりにこれらの方法を使うと、以前行ったタスクがどれだけ楽になるかを確認します。まずは、データセットをDask DataFrameに読み込むところから始めます。

지침

100 XP
  • dask.dataframe サブパッケージを dd としてインポートします。
  • data/spotify フォルダ内のすべてのCSVファイルを、最大ブロックサイズを1MBにして読み込みます。
  • dd.to_datetime() 関数を使って、'release_date' 列の文字列を日時型に変換します。
  • DataFrameの .head() メソッドで表の先頭5行を表示します。