BaşlayınÜcretsiz Başlayın

Çıkarım yap ve filtrele

Başlık ve şeması olduğunu bildiğin bir nüfus sayımı veri kümen olduğunu hayal et. Hadi bu veri kümesini yükleyelim ve şemanın PySpark tarafından çıkarılmasını sağlayalım. 40 yaş üstü yetişkinleri filtrelediğinde ne görüyorsun?

Unutma, çalışma alanında zaten SparkSession adlı spark var!

Bu egzersiz

PySpark'e Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • adults.json adlı bir JSON dosyasını yükle.
  • Veriyi age değeri 40'ın üzerinde olan yetişkinlerle sınırla.
  • Sonuçları göster.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Load the dataframe
census_df = spark.read.json("adults.json")

# Filter rows based on age condition
salary_filtered_census = census_df.____(census_df[____]____)

# Show the result
____
Kodu Düzenle ve Çalıştır