BaşlayınÜcretsiz başlayın

Dosya boyutu optimizasyonu

10 düğümlü bir kümede 2 büyük veri dosyası verildiğini düşün. Her dosyada yaklaşık olarak aynı boyutta 10 milyon satır var. Verinle çalışırken yanıt verme hızı kabul edilebilir, ancak dosyalardan ilk okuma oldukça uzun sürüyor. Veriyi yalnızca senin kullanacağını ve her çalıştırmada verinin değiştiğini unutma.

Aşağıdakilerden hangisi performansı iyileştirmek için en iyi seçenektir?

Bu egzersiz, kursun bir parçasıdır

PySpark ile Veri Temizleme

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Teoriyi etkileşime dönüştürün, interaktif egzersizlerimizden biriyle

Egzersize başla