1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn PySpark

Connected

Bài tập

Tổng hợp mọi thứ II

Tạo một DataFrame, áp dụng các biến đổi, lưu đệm (cache) nó và kiểm tra xem nó đã được lưu đệm chưa. Sau đó, bỏ lưu đệm để giải phóng bộ nhớ. Trong bài này, một phiên spark đã được tạo sẵn cho bạn! Hãy xem kỹ kết quả của phương thức .explain() để hiểu kết quả là gì!

Hướng dẫn

100 XP
  • Lưu đệm (cache) DataFrame df.
  • Giải thích quá trình xử lý của DataFrame agg_result.
  • Gỡ lưu đệm (unpersist) DataFrame df đã lưu đệm sau khi xử lý.