Vektör verisine bir UDF uygulamak
vector tipinde output adlı bir sütunu olan df adlı bir dataframe mevcut. İlk beş satırı konsolda gösteriliyor.
Bir vektör sütununun ilk öğesini seçen get_first_udf adlı bir UDF mevcut.
Bu egzersiz
Python ile Spark SQL'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
df'e yeni bir sütun ekleyerekdf_newadlı yeni bir dataframe oluştur. Yeni sütunun adılabelolsun.df_new'in ilk beş satırını göster.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Add label by applying the get_first_udf to output column
df_new = df.____('____', ____('____'))
# Show the first five rows
df_new.____