BaşlayınÜcretsiz başlayın

PySpark UDF'lerinde tamsayılar

Bu egzersiz UDF'leri kapsıyor; PySpark'ta fonksiyon oluşturmayı anlamana yardımcı olacak! Egzersizi yaparken bunun bir veri temizleme iş akışında neyin yerini alabileceğini düşün.

Unutma, çalışma alanında zaten spark adlı bir SparkSession var!

Bu egzersiz, kursun bir parçasıdır

PySpark'e Giriş

Kursa Göz Atın

Egzersiz talimatları

  • age_category fonksiyonunu age_category_udf adlı bir UDF olarak kaydet.
  • df DataFrame'ine, yaşa göre kişileri kategorize etmek için UDF'yi uygulayan "category" adlı yeni bir sütun ekle. age_category_udf() için argüman senin için verildi.
  • Ortaya çıkan DataFrame'i göster.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Register the function age_category as a UDF
age_category_udf = ____(age_category, StringType())

# Apply your udf to the DataFrame
age_category_df_2 = age_category_df.withColumn("category", ____(age_category_df["age"]))

# Show df
age_category_df_2.____
Kodu Düzenle ve Çalıştır