Mulai sekarangMulai gratis

Menerapkan UDF pada data vektor

Sebuah dataframe tersedia dengan nama df yang memiliki kolom output bertipe vector. Lima baris pertamanya ditampilkan di konsol.

Sebuah UDF get_first_udf tersedia untuk memilih elemen pertama dari kolom vektor.

Latihan ini merupakan bagian dari kursus

Pengantar Spark SQL dalam Python

Lihat Kursus

Instruksi latihan

  • Buat dataframe baru bernama df_new dengan menambahkan kolom baru ke df. Beri nama kolom baru tersebut label.
  • Tampilkan lima baris pertama dari df_new.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Add label by applying the get_first_udf to output column
df_new = df.____('____', ____('____'))

# Show the first five rows 
df_new.____
Edit dan Jalankan Kode