1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn PySpark

Connected

Bài tập

Tổng hợp trong PySpark

Bây giờ bạn đã sẵn sàng tự mình thực hiện một vài phép tổng hợp! Bạn sẽ dùng lại bộ dữ liệu lương mà bạn đã sử dụng trước đó. Hãy xem bạn có thể tạo ra những phép tổng hợp nào! Một SparkSession tên là spark đã có sẵn trong không gian làm việc của bạn, cùng với Spark DataFrame salaries_df.

Hướng dẫn

100 XP
  • Tìm mức lương tối thiểu tại một công ty ở Mỹ, quy mô Small – thực hiện lọc bằng cách tham chiếu trực tiếp đến cột ("salary_in_usd"), không truyền chuỗi SQL.
  • Tìm mức lương tối đa tại một công ty ở Mỹ, quy mô Large, ký hiệu "L" – thực hiện lọc bằng cách tham chiếu trực tiếp đến cột ("salary_in_usd"), không truyền chuỗi SQL.