1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ Spark SQL 入門

Connected

演習

ベクターデータへの UDF の適用

vector 型の列 output を持つデータフレーム df が利用可能です。最初の 5 行はコンソールに表示されています。

ベクター列の最初の要素を選択する UDF get_first_udf が用意されています。

指示

100 XP
  • df に新しい列を追加して、新しいデータフレーム df_new を作成します。新しい列名は label とします。
  • df_new の先頭 5 行を表示します。