1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ Spark SQL 入門

Connected

演習

キャッシュの練習:SQL

前回は、2つのDataFrame(df1 と、df1 から作成した df2)を確認しました。そこで df1 はキャッシュしましたが、df2 はキャッシュしませんでした。本演習ではその逆を行い、df2 をキャッシュし、df1 はキャッシュしない場合の効果を見ていきます。

各アクションにかかる時間を再び記録してください。次の演習で比較します。どのタスクが速くなり、どのタスクが遅くなりますか?

指示

100 XP
  • df2 をキャッシュし、df1 はキャッシュしないでください。
  • df1 に対してアクションを1回実行してからもう一度繰り返し、続いて df2 に対してアクションを実行してからもう一度繰り返してください。これはすでに用意されています。