BaşlayınÜcretsiz Başlayın

Dosya boyutu optimizasyonu

10 düğümlü bir kümede 2 büyük veri dosyası verildiğini düşün. Her dosyada yaklaşık olarak aynı boyutta 10 milyon satır var. Verinle çalışırken yanıt verme hızı kabul edilebilir, ancak dosyalardan ilk okuma oldukça uzun sürüyor. Veriyi yalnızca senin kullanacağını ve her çalıştırmada verinin değiştiğini unutma.

Aşağıdakilerden hangisi performansı iyileştirmek için en iyi seçenektir?

Bu egzersiz

PySpark ile Veri Temizleme

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün

Egzersizi başlat