Intip Fitur GX
Kerja bagus membuat Data Context Anda! Ini adalah langkah awal yang kuat ke dunia Great Expectations. Mari kita mengintip berbagai hal menarik yang dapat Anda lakukan pada akhir kursus.
Kode di sebelah kanan menggunakan Data Context untuk membuat Data Source dan Data Asset pandas, yang mendefinisikan format datanya. Lalu, kode tersebut membuat Batch Definition untuk membaca data. Terakhir, kode membuat Expectation Suite, yang berisi sebuah Expectation, serta Validation Definition, yang menjalankan Expectation Suite terhadap Batch data. Jangan khawatir jika Anda belum memahami istilah-istilah ini sekarang — semuanya akan jelas pada akhir kursus!
Great Expectations sudah diimpor untuk Anda sebagai gx.
Latihan ini adalah bagian dari kursus
Pengantar Data Quality dengan Great Expectations
Petunjuk latihan
- Tekan
Run Codeuntuk melihat keluaran kode.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create Data Context
context = gx.get_context()
# Create pandas Data Source, Data Asset, and Batch Definition
data_source = context.data_sources.add_pandas(
name="my_pandas_datasource"
)
data_asset = data_source.add_dataframe_asset(
name="my_data_asset"
)
batch_definition = data_asset.add_batch_definition_whole_dataframe(
name="my_batch_definition"
)
batch = batch_definition.get_batch(
batch_parameters={"dataframe": dataframe}
)
# Create Expectation Suite and Validation Definition
suite = context.suites.add(
gx.ExpectationSuite(name="my_suite", suite_parameters={})
)
validation_definition = gx.ValidationDefinition(
data=batch_definition, suite=suite, name="validation"
)
# Establish and evaluate an Expectation
expectation = gx.expectations.ExpectTableRowCountToBeBetween(
min_value=50000, max_value=100000
)
validation_results = batch.validate(expect=expectation)
print(validation_results.success)