BaşlayınÜcretsiz başlayın

GX’e Hızlı Bir Bakış

Data Context oluşturduğun için harika iş çıkardın! Bu, Great Expectations dünyasına güçlü bir ilk adım. Haydi kursun sonunda yapabilecek olduğun tüm havalı şeylere hızlıca bir göz atalım.

Sağdaki kod, veri biçimini tanımlayan bir pandas Data Source ve Data Asset oluşturmak için Data Context’i kullanıyor. Ardından veriyi okumak için bir Batch Definition oluşturuyor. Son olarak bir Expectation Suite (içinde bir Expectation bulunan) ve bu Expectation Suite’i veri Batch’i üzerinde çalıştıran bir Validation Definition yaratıyor. Bu terimleri şu anda anlamıyor olman sorun değil — kursun sonunda hepsi netleşecek!

Great Expectations senin için gx olarak içe aktarılmış durumda.

Bu egzersiz, kursun bir parçasıdır

Great Expectations ile Veri Kalitesine Giriş

Kursa Göz Atın

Egzersiz talimatları

  • Kod çıktısını görmek için Run Codea bas.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create Data Context
context = gx.get_context()

# Create pandas Data Source, Data Asset, and Batch Definition
data_source = context.data_sources.add_pandas(
  name="my_pandas_datasource"
)
data_asset = data_source.add_dataframe_asset(
  name="my_data_asset"
)
batch_definition = data_asset.add_batch_definition_whole_dataframe(
  name="my_batch_definition"
)
batch = batch_definition.get_batch(
  batch_parameters={"dataframe": dataframe}
)

# Create Expectation Suite and Validation Definition
suite = context.suites.add(
  gx.ExpectationSuite(name="my_suite", suite_parameters={})
)
validation_definition = gx.ValidationDefinition(
  data=batch_definition, suite=suite, name="validation"
)

# Establish and evaluate an Expectation
expectation = gx.expectations.ExpectTableRowCountToBeBetween(
  min_value=50000, max_value=100000
)
validation_results = batch.validate(expect=expectation)
print(validation_results.success)
Kodu Düzenle ve Çalıştır