Menerapkan UDF pada data vektor
Sebuah dataframe tersedia dengan nama df yang memiliki kolom output bertipe vector. Lima baris pertamanya ditampilkan di konsol.
Sebuah UDF get_first_udf tersedia untuk memilih elemen pertama dari kolom vektor.
Latihan ini adalah bagian dari kursus
Pengantar Spark SQL dalam Python
Petunjuk latihan
- Buat dataframe baru bernama
df_newdengan menambahkan kolom baru kedf. Beri nama kolom baru tersebutlabel. - Tampilkan lima baris pertama dari
df_new.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Add label by applying the get_first_udf to output column
df_new = df.____('____', ____('____'))
# Show the first five rows
df_new.____