Parquet anlık görüntüsü yazma

Aşağı akıştaki bir kontrol paneli, dijital e-kitap etkinliğinin daha ince bir Parquet anlık görüntüsüne ihtiyaç duyuyor. Sonucu tembel (lazy) biçimde oluştur, ardından dosyayı hızlı okumalar için ayarlamak amacıyla sıkıştırma ve satır grubu ayarlarını açıkça belirterek geri yaz.

requests adlı LazyFrame hazır ve dışa aktarma yolu PARQUET_EXPORT_PATH içinde.

Bu egzersiz, kursun bir parçasıdır

Polars ile Veri Hatlarını Ölçeklendirme ve Optimize Etme

Kursa Göz Atın

Egzersiz talimatları

Anlık görüntü için yalnızca ilk 500 dijital satırı tut.
Parquet dosyasını yazarken compression_level değerini 5 olarak ayarla.
row_group_size değerini 250 satır olarak ayarla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

result = (
    requests
    .filter(pl.col("use") == "Digital")
    .select("date", "format", "checkouts", "title")
    # Keep only the first 500 rows
    .____(500)
    .collect()
)

result.write_parquet(
    PARQUET_EXPORT_PATH,
    # Set compression level to 5
    compression_level=____,
    # Set 250 rows per row group
    row_group_size=____,
)

print(pl.read_parquet_schema(PARQUET_EXPORT_PATH))

Kodu Düzenle ve Çalıştır