1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Python에서 Spark SQL 입문

Connected

Bài tập

벡터 데이터에 UDF 적용하기

vector 타입의 output 열을 가진 df라는 데이터프레임이 있습니다. 처음 다섯 행은 콘솔에 표시되어 있어요.

벡터 열의 첫 번째 원소를 선택하는 UDF get_first_udf가 제공됩니다.

Hướng dẫn

100 XP
  • df에 새 열을 추가해 df_new라는 새 데이터프레임을 만드세요. 새 열 이름은 label로 하세요.
  • df_new의 처음 다섯 행을 표시하세요.