BaşlayınÜcretsiz Başlayın

Veri doğrulama gerçekleştirme

Artık şemayı tanımladığına göre, veri doğrulaması yapma zamanı. Bu egzersizde, veri kalitesini güvence altına almak ve kopyalar ile null değerler gibi yaygın sorunları kontrol etmek için doğrulama kuralları oluşturacaksın.

Önceki egzersizdeki table_schema, ts DataFrame'i ve pointblank kütüphanesi senin için önceden yüklendi.

Bu egzersiz

Üretim için Tahmin (Forecasting) Hatları Tasarlama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Doğrulamayı doğru yöntemle tanımla ve ts DataFrame'ini geçir.
  • table_schema ile doğrulama kurallarını ayarla ve kopyaları kontrol et.
  • Doğrulama raporunu yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Define the validation
validation = (pb.____(data=____,
tbl_name="US48 Data Validation",
label="Data Refresh",
thresholds=pb.Thresholds(warning=0.2, error=0, critical=0.1))
             
    # Set up the validation rules
    .col_schema_match(schema=____)
    .col_vals_gt(columns="value", value=0)
    .col_vals_in_set(columns="respondent", set = ["US48"])
    .col_vals_in_set(columns="type", set = ["D"])
    .col_vals_not_null(columns=["period", "value"])
    .____()
    .interrogate())

# Print the validation report
print(validation.____())
Kodu Düzenle ve Çalıştır