Çıkarım yap ve filtrele
Başlık ve şeması olduğunu bildiğin bir nüfus sayımı veri kümen olduğunu hayal et. Hadi bu veri kümesini yükleyelim ve şemanın PySpark tarafından çıkarılmasını sağlayalım. 40 yaş üstü yetişkinleri filtrelediğinde ne görüyorsun?
Unutma, çalışma alanında zaten SparkSession adlı spark var!
Bu egzersiz, kursun bir parçasıdır
PySpark'e Giriş
Egzersiz talimatları
adults.jsonadlı bir JSON dosyasını yükle.- Veriyi
agedeğeri40'ın üzerinde olan yetişkinlerle sınırla. - Sonuçları göster.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Load the dataframe
census_df = spark.read.json("adults.json")
# Filter rows based on age condition
salary_filtered_census = census_df.____(census_df[____]____)
# Show the result
____