1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 Spark SQL 입문

Connected

연습 문제

벡터 데이터용 UDF 만들기

벡터 타입의 output 열을 가진 데이터프레임 df가 제공되어 있어요. 콘솔에는 처음 다섯 개 행이 표시되어 있습니다.

지침

100 XP
  • first_udf라는 UDF를 만드세요. 이 함수는 벡터 열의 첫 번째 원소를 선택합니다. 하나 이상의 원소를 포함한 벡터가 아닌 항목에 대해서는 기본값 0.0을 반환하고, 출력은 float으로 캐스팅하세요.
  • df에 대해 select 연산을 사용해 output 열에 first_udf를 적용하세요.