BaşlayınÜcretsiz Başlayın

Vektör verisine bir UDF uygulamak

vector tipinde output adlı bir sütunu olan df adlı bir dataframe mevcut. İlk beş satırı konsolda gösteriliyor.

Bir vektör sütununun ilk öğesini seçen get_first_udf adlı bir UDF mevcut.

Bu egzersiz

Python ile Spark SQL'e Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • df'e yeni bir sütun ekleyerek df_new adlı yeni bir dataframe oluştur. Yeni sütunun adı label olsun.
  • df_new'in ilk beş satırını göster.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Add label by applying the get_first_udf to output column
df_new = df.____('____', ____('____'))

# Show the first five rows 
df_new.____
Kodu Düzenle ve Çalıştır