GX’e Hızlı Bir Bakış
Data Context oluşturduğun için harika iş çıkardın! Bu, Great Expectations dünyasına güçlü bir ilk adım. Haydi kursun sonunda yapabilecek olduğun tüm havalı şeylere hızlıca bir göz atalım.
Sağdaki kod, veri biçimini tanımlayan bir pandas Data Source ve Data Asset oluşturmak için Data Context’i kullanıyor. Ardından veriyi okumak için bir Batch Definition oluşturuyor. Son olarak bir Expectation Suite (içinde bir Expectation bulunan) ve bu Expectation Suite’i veri Batch’i üzerinde çalıştıran bir Validation Definition yaratıyor. Bu terimleri şu anda anlamıyor olman sorun değil — kursun sonunda hepsi netleşecek!
Great Expectations senin için gx olarak içe aktarılmış durumda.
Bu egzersiz
Great Expectations ile Veri Kalitesine Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Kod çıktısını görmek için
Run Codea bas.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create Data Context
context = gx.get_context()
# Create pandas Data Source, Data Asset, and Batch Definition
data_source = context.data_sources.add_pandas(
name="my_pandas_datasource"
)
data_asset = data_source.add_dataframe_asset(
name="my_data_asset"
)
batch_definition = data_asset.add_batch_definition_whole_dataframe(
name="my_batch_definition"
)
batch = batch_definition.get_batch(
batch_parameters={"dataframe": dataframe}
)
# Create Expectation Suite and Validation Definition
suite = context.suites.add(
gx.ExpectationSuite(name="my_suite", suite_parameters={})
)
validation_definition = gx.ValidationDefinition(
data=batch_definition, suite=suite, name="validation"
)
# Establish and evaluate an Expectation
expectation = gx.expectations.ExpectTableRowCountToBeBetween(
min_value=50000, max_value=100000
)
validation_results = batch.validate(expect=expectation)
print(validation_results.success)