1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark入門

Connected

演習

総復習 II

DataFrame を作成し、変換を適用してからキャッシュし、キャッシュされているか確認します。最後に、メモリを解放するためにキャッシュを解除します。 この演習では spark セッションが用意されています!.explain() メソッドの出力をよく確認して、処理の結果がどうなるか理解しましょう!

指示

100 XP
  • df DataFrame をキャッシュします。
  • agg_result DataFrame の処理内容を説明します。
  • 処理後にキャッシュした df DataFrame を unpersist(解除)します。