1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Spark SQL bằng Python

Connected

Bài tập

Áp dụng UDF cho dữ liệu vector

Có một dataframe tên df với cột output kiểu vector. Năm hàng đầu tiên được hiển thị trên bảng điều khiển.

Có sẵn một UDF get_first_udf để chọn phần tử đầu tiên của một cột vector.

Hướng dẫn

100 XP
  • Tạo một dataframe mới tên df_new bằng cách thêm một cột mới vào df. Đặt tên cột mới là label.
  • Hiển thị năm hàng đầu tiên của df_new.