1. Learn
  2. /
  3. Courses
  4. /
  5. Nhập môn PySpark

Connected

Exercise

Số nguyên trong UDF của PySpark

Bài tập này nói về UDF, giúp bạn hiểu cách tạo hàm trong PySpark! Khi thực hiện, hãy nghĩ xem điều này sẽ thay thế bước nào trong quy trình làm sạch dữ liệu.

Hãy nhớ rằng đã có sẵn một SparkSession tên là spark trong không gian làm việc của bạn!

Instructions

100 XP
  • Đăng ký hàm age_category thành một UDF có tên age_category_udf.
  • Thêm một cột mới vào DataFrame df tên "category" và áp dụng UDF để phân loại mọi người dựa trên độ tuổi của họ. Đối số cho age_category_udf() đã được cung cấp.
  • Hiển thị DataFrame kết quả.