Eksik sütunları ekleme

Bir yılın çıkarılmış dosyasında pub sütunu (publisher) eksik, ancak ekip yine de iki dosyayı tek bir veri kümesi olarak taramak istiyor. Polars'ın hata vermek yerine eksik sütunlara null eklemesi için doğru bağımsız değişkeni seç.

polars pl olarak yüklü ve dizin DRIFT_DIR içinde. Şema farkını görebilmen için her dosyanın başlığı senin için yazdırılıyor.

Bu egzersiz, kursun bir parçasıdır

Polars ile Veri Hatlarını Ölçeklendirme ve Optimize Etme

Kursa Göz Atın

Egzersiz talimatları

DRIFT_DIR içindeki tüm seattle_*.csv dosyalarını taramak için bir glob deseni kullan.
Bazı dosyalarda eksik olan sütunlar için Polars'ın null eklemesini sağlayacak doğru bağımsız değişkeni ekle.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Scan both yearly files as one combined dataset
combined = pl.scan_csv(
    str(DRIFT_DIR / "____"),
    try_parse_dates=True,
    # Insert missing columns instead of failing on schema differences
    ____="____",
)

result = combined.select("date", "format", "title", "pub").collect()

print("First rows (from 2023 file):")
print(result.head(3))
print("\nLast rows (from 2024 file):")
print(result.tail(3))

Kodu Düzenle ve Çalıştır