PySpark UDF'lerinde tamsayılar
Bu egzersiz UDF'leri kapsıyor; PySpark'ta fonksiyon oluşturmayı anlamana yardımcı olacak! Egzersizi yaparken bunun bir veri temizleme iş akışında neyin yerini alabileceğini düşün.
Unutma, çalışma alanında zaten spark adlı bir SparkSession var!
Bu egzersiz
PySpark'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
age_categoryfonksiyonunuage_category_udfadlı bir UDF olarak kaydet.dfDataFrame'ine, yaşa göre kişileri kategorize etmek için UDF'yi uygulayan"category"adlı yeni bir sütun ekle.age_category_udf()için argüman senin için verildi.- Ortaya çıkan DataFrame'i göster.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Register the function age_category as a UDF
age_category_udf = ____(age_category, StringType())
# Apply your udf to the DataFrame
age_category_df_2 = age_category_df.withColumn("category", ____(age_category_df["age"]))
# Show df
age_category_df_2.____