1. Learn
  2. /
  3. Courses
  4. /
  5. Nhập môn PySpark

Connected

Exercise

Tổng hợp trong RDD

Giờ bạn đã thực hiện phân tích với DataFrame trong PySpark, hãy thử nhanh một tác vụ tương tự với RDD. Sử dụng đoạn mã được cung cấp, hãy tính tổng các giá trị của một RDD trong PySpark.

Một phiên Spark tên là spark đã được tạo sẵn cho bạn.

Instructions

100 XP
  • Tạo một RDD từ DataFrame đã cho.
  • Áp dụng Hàm Lambda đã cung cấp lên các key của RDD.
  • Thu thập (collect) kết quả của phép tổng hợp.