1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu với PySpark

Connected

Bài tập

Ví dụ when()

Mệnh đề when() cho phép bạn thay đổi có điều kiện một DataFrame dựa trên nội dung của nó. Bạn sẽ chỉnh sửa DataFrame voter_df để cộng một số ngẫu nhiên cho bất kỳ cử tri nào có chức danh là "Councilmember".

DataFrame voter_df đã được định nghĩa và sẵn sàng cho bạn. Thư viện pyspark.sql.functions đã được import với bí danh F. Bạn có thể dùng F.rand() để tạo giá trị ngẫu nhiên.

Hướng dẫn

100 XP
  • Thêm một cột vào voter_df tên là random_val với kết quả của phương thức F.rand() cho mọi cử tri có chức danh Councilmember.
  • Hiển thị một số hàng của DataFrame, lưu ý xem mệnh đề .when() có hoạt động hay không.