1. Învăţa
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶDaskによる並列プログラミング

Connected

exercise

保存されたテキストからbagを作成する

今回は、同僚がレビューをテキストファイルに保存しました。ファイルは複数あり、各ファイルにも複数のレビューが含まれています。各レビューはテキストファイルの1行に対応しています。

これらをDaskで遅延読み込みし、並列処理を使ってより速く分析したいと考えています。

dask.bag は db としてインポート済みです。

Instrucţiuni

100 XP
  • read_text() 関数を使って、ディレクトリ data/tripadvisor_hotel_reviews 内のすべての .txt ファイルを読み込みます。
  • bag に含まれるレビュー数を数えます。
  • bag の .compute() メソッドを使って答えを出力します。