Dosya boyutu optimizasyonu
10 düğümlü bir kümede 2 büyük veri dosyası verildiğini düşün. Her dosyada yaklaşık olarak aynı boyutta 10 milyon satır var. Verinle çalışırken yanıt verme hızı kabul edilebilir, ancak dosyalardan ilk okuma oldukça uzun sürüyor. Veriyi yalnızca senin kullanacağını ve her çalıştırmada verinin değiştiğini unutma.
Aşağıdakilerden hangisi performansı iyileştirmek için en iyi seçenektir?
Bu egzersiz
PySpark ile Veri Temizleme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün
Egzersizi başlat