Vektör verisi için bir UDF oluşturma
vector türünde output adlı bir sütunu olan bir dataframe df mevcut. İlk beş satırı konsolda gösteriliyor.
Bu egzersiz
Python ile Spark SQL'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
first_udfadlı bir UDF oluştur. Bu UDF, bir vektör sütununun ilk elemanını seçer. En az bir öğe içeren bir vektör olmayan tüm öğeler için sonucu varsayılan olarak 0.0 yap ve çıktıyı float olarak dönüştür.dfüzerindeselectişlemini kullanarakfirst_udf'ioutputsütununa uygula.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Selects the first element of a vector column
first_udf = ____(lambda x:
____(x.indices[0])
if (x and hasattr(x, "toArray") and x.____())
else 0.0,
FloatType())
# Apply first_udf to the output column
df.select(____("output").alias("result")).show(5)