1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Python 中的 Spark SQL 入门

Connected

cvičení

将 UDF 应用于向量数据

已经提供名为 df 的 dataframe,其中包含一个类型为 vector 的列 output。其前 5 行已在控制台中显示。

提供了一个 UDF get_first_udf,用于选取向量列的第一个元素。

Pokyny

100 XP
  • 通过给 df 添加新列创建一个名为 df_new 的新 dataframe。将新列命名为 label。
  • 显示 df_new 的前 5 行。