BaşlayınÜcretsiz başlayın

PySpark dosyalarını çalıştırma

Bu egzersizde spark-submit kullanarak bir PySpark dosyası çalıştıracaksın. Bu araç, uygulamanı bir Spark kümesine göndermene yardımcı olur.

Bu egzersiz için, 4 iş parçacığında çalışan yerel bir Spark örneğiyle çalışacaksın. Göndermen gereken dosya /home/repl/spark-script.py konumunda. Dosyayı okumakta özgürsün:

cat /home/repl/spark-script.py

spark-submit komutunu aşağıdaki gibi kullanabilirsin:

spark-submit \
  --master local[4] \
  /home/repl/spark-script.py

Bu komut ne çıktı verir? Sonuçların gelmesi birkaç saniye sürebilir.

Bu egzersiz, kursun bir parçasıdır

Data Engineering'e Giriş

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Teoriyi etkileşime dönüştürün, interaktif egzersizlerimizden biriyle

Egzersize başla