MulaiMulai sekarang secara gratis

Menerapkan UDF pada data vektor

Sebuah dataframe tersedia dengan nama df yang memiliki kolom output bertipe vector. Lima baris pertamanya ditampilkan di konsol.

Sebuah UDF get_first_udf tersedia untuk memilih elemen pertama dari kolom vektor.

Latihan ini adalah bagian dari kursus

Pengantar Spark SQL dalam Python

Lihat Kursus

Petunjuk latihan

  • Buat dataframe baru bernama df_new dengan menambahkan kolom baru ke df. Beri nama kolom baru tersebut label.
  • Tampilkan lima baris pertama dari df_new.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Add label by applying the get_first_udf to output column
df_new = df.____('____', ____('____'))

# Show the first five rows 
df_new.____
Edit dan Jalankan Kode