Veri doğrulama gerçekleştirme
Artık şemayı tanımladığına göre, veri doğrulaması yapma zamanı. Bu egzersizde, veri kalitesini güvence altına almak ve kopyalar ile null değerler gibi yaygın sorunları kontrol etmek için doğrulama kuralları oluşturacaksın.
Önceki egzersizdeki table_schema, ts DataFrame'i ve pointblank kütüphanesi senin için önceden yüklendi.
Bu egzersiz
Üretim için Tahmin (Forecasting) Hatları Tasarlama
kursunun bir parçasıdırEgzersiz talimatları
- Doğrulamayı doğru yöntemle tanımla ve
tsDataFrame'ini geçir. table_schemaile doğrulama kurallarını ayarla ve kopyaları kontrol et.- Doğrulama raporunu yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Define the validation
validation = (pb.____(data=____,
tbl_name="US48 Data Validation",
label="Data Refresh",
thresholds=pb.Thresholds(warning=0.2, error=0, critical=0.1))
# Set up the validation rules
.col_schema_match(schema=____)
.col_vals_gt(columns="value", value=0)
.col_vals_in_set(columns="respondent", set = ["US48"])
.col_vals_in_set(columns="type", set = ["D"])
.col_vals_not_null(columns=["period", "value"])
.____()
.interrogate())
# Print the validation report
print(validation.____())