ComeçarComece de graça

Visão rápida do GX

Bom trabalho criando seu Data Context! Esse é o primeiro passo poderoso no mundo do Great Expectations. Vamos dar uma espiada nas coisas legais que você vai conseguir fazer até o final do curso.

O código à direita usa o Data Context para criar um Data Source e um Data Asset do pandas, que definem o formato dos dados. Em seguida, ele cria uma Batch Definition para ler os dados. Por fim, cria uma Expectation Suite, que contém uma Expectation, e uma Validation Definition, que executa a Expectation Suite no Batch de dados. Não se preocupe se esses termos ainda não fazem sentido — tudo vai ficar claro até o fim do curso!

Great Expectations já foi importado para você como gx.

Este exercício faz parte do curso

Introdução à Qualidade de Dados com Great Expectations

Ver curso

Instruções do exercício

  • Pressione Run Code para ver a saída do código.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create Data Context
context = gx.get_context()

# Create pandas Data Source, Data Asset, and Batch Definition
data_source = context.data_sources.add_pandas(
  name="my_pandas_datasource"
)
data_asset = data_source.add_dataframe_asset(
  name="my_data_asset"
)
batch_definition = data_asset.add_batch_definition_whole_dataframe(
  name="my_batch_definition"
)
batch = batch_definition.get_batch(
  batch_parameters={"dataframe": dataframe}
)

# Create Expectation Suite and Validation Definition
suite = context.suites.add(
  gx.ExpectationSuite(name="my_suite", suite_parameters={})
)
validation_definition = gx.ValidationDefinition(
  data=batch_definition, suite=suite, name="validation"
)

# Establish and evaluate an Expectation
expectation = gx.expectations.ExpectTableRowCountToBeBetween(
  min_value=50000, max_value=100000
)
validation_results = batch.validate(expect=expectation)
print(validation_results.success)
Editar e executar o código