Veri doğrulama gerçekleştirme
Artık şemayı tanımladığına göre, veri doğrulaması yapma zamanı. Bu egzersizde, veri kalitesini güvence altına almak ve kopyalar ile null değerler gibi yaygın sorunları kontrol etmek için doğrulama kuralları oluşturacaksın.
Önceki egzersizdeki table_schema, ts DataFrame'i ve pointblank kütüphanesi senin için önceden yüklendi.
Bu egzersiz, kursun bir parçasıdır
Üretim için Tahmin (Forecasting) Hatları Tasarlama
Egzersiz talimatları
- Doğrulamayı doğru yöntemle tanımla ve
tsDataFrame'ini geçir. table_schemaile doğrulama kurallarını ayarla ve kopyaları kontrol et.- Doğrulama raporunu yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Define the validation
validation = (pb.____(data=____,
tbl_name="US48 Data Validation",
label="Data Refresh",
thresholds=pb.Thresholds(warning=0.2, error=0, critical=0.1))
# Set up the validation rules
.col_schema_match(schema=____)
.col_vals_gt(columns="value", value=0)
.col_vals_in_set(columns="respondent", set = ["US48"])
.col_vals_in_set(columns="type", set = ["D"])
.col_vals_not_null(columns=["period", "value"])
.____()
.interrogate())
# Print the validation report
print(validation.____())