Çıkarım yap ve filtrele
Başlık ve şeması olduğunu bildiğin bir nüfus sayımı veri kümen olduğunu hayal et. Hadi bu veri kümesini yükleyelim ve şemanın PySpark tarafından çıkarılmasını sağlayalım. 40 yaş üstü yetişkinleri filtrelediğinde ne görüyorsun?
Unutma, çalışma alanında zaten SparkSession adlı spark var!
Bu egzersiz
PySpark'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
adults.jsonadlı bir JSON dosyasını yükle.- Veriyi
agedeğeri40'ın üzerinde olan yetişkinlerle sınırla. - Sonuçları göster.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load the dataframe
census_df = spark.read.json("adults.json")
# Filter rows based on age condition
salary_filtered_census = census_df.____(census_df[____]____)
# Show the result
____