MulaiMulai sekarang secara gratis

Intip Fitur GX

Kerja bagus membuat Data Context Anda! Ini adalah langkah awal yang kuat ke dunia Great Expectations. Mari kita mengintip berbagai hal menarik yang dapat Anda lakukan pada akhir kursus.

Kode di sebelah kanan menggunakan Data Context untuk membuat Data Source dan Data Asset pandas, yang mendefinisikan format datanya. Lalu, kode tersebut membuat Batch Definition untuk membaca data. Terakhir, kode membuat Expectation Suite, yang berisi sebuah Expectation, serta Validation Definition, yang menjalankan Expectation Suite terhadap Batch data. Jangan khawatir jika Anda belum memahami istilah-istilah ini sekarang — semuanya akan jelas pada akhir kursus!

Great Expectations sudah diimpor untuk Anda sebagai gx.

Latihan ini adalah bagian dari kursus

Pengantar Data Quality dengan Great Expectations

Lihat Kursus

Petunjuk latihan

  • Tekan Run Code untuk melihat keluaran kode.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create Data Context
context = gx.get_context()

# Create pandas Data Source, Data Asset, and Batch Definition
data_source = context.data_sources.add_pandas(
  name="my_pandas_datasource"
)
data_asset = data_source.add_dataframe_asset(
  name="my_data_asset"
)
batch_definition = data_asset.add_batch_definition_whole_dataframe(
  name="my_batch_definition"
)
batch = batch_definition.get_batch(
  batch_parameters={"dataframe": dataframe}
)

# Create Expectation Suite and Validation Definition
suite = context.suites.add(
  gx.ExpectationSuite(name="my_suite", suite_parameters={})
)
validation_definition = gx.ValidationDefinition(
  data=batch_definition, suite=suite, name="validation"
)

# Establish and evaluate an Expectation
expectation = gx.expectations.ExpectTableRowCountToBeBetween(
  min_value=50000, max_value=100000
)
validation_results = batch.validate(expect=expectation)
print(validation_results.success)
Edit dan Jalankan Kode