BaşlayınÜcretsiz Başlayın

PySpark UDF'lerinde tamsayılar

Bu egzersiz UDF'leri kapsıyor; PySpark'ta fonksiyon oluşturmayı anlamana yardımcı olacak! Egzersizi yaparken bunun bir veri temizleme iş akışında neyin yerini alabileceğini düşün.

Unutma, çalışma alanında zaten spark adlı bir SparkSession var!

Bu egzersiz

PySpark'e Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • age_category fonksiyonunu age_category_udf adlı bir UDF olarak kaydet.
  • df DataFrame'ine, yaşa göre kişileri kategorize etmek için UDF'yi uygulayan "category" adlı yeni bir sütun ekle. age_category_udf() için argüman senin için verildi.
  • Ortaya çıkan DataFrame'i göster.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Register the function age_category as a UDF
age_category_udf = ____(age_category, StringType())

# Apply your udf to the DataFrame
age_category_df_2 = age_category_df.withColumn("category", ____(age_category_df["age"]))

# Show df
age_category_df_2.____
Kodu Düzenle ve Çalıştır