Vektör verisine bir UDF uygulamak
vector tipinde output adlı bir sütunu olan df adlı bir dataframe mevcut. İlk beş satırı konsolda gösteriliyor.
Bir vektör sütununun ilk öğesini seçen get_first_udf adlı bir UDF mevcut.
Bu egzersiz, kursun bir parçasıdır
Python ile Spark SQL'e Giriş
Egzersiz talimatları
df'e yeni bir sütun ekleyerekdf_newadlı yeni bir dataframe oluştur. Yeni sütunun adılabelolsun.df_new'in ilk beş satırını göster.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Add label by applying the get_first_udf to output column
df_new = df.____('____', ____('____'))
# Show the first five rows
df_new.____