ComenzarEmpieza gratis

Vista previa de GX

¡Buen trabajo creando tu Data Context! Este es un primer paso potente en el mundo de Great Expectations. Echemos un vistazo rápido a todas las cosas interesantes que podrás hacer al final del curso.

El código de la derecha usa el Data Context para crear un Data Source y un Data Asset de pandas, que definen el formato de los datos. Luego, crea una Batch Definition para leer los datos. Por último, crea una Expectation Suite, que contiene una Expectation, y una Validation Definition, que ejecuta la Expectation Suite sobre el Batch de datos. No te preocupes si ahora mismo no entiendes estos términos: ¡todo quedará claro al final del curso!

Great Expectations ya se ha importado como gx.

Este ejercicio forma parte del curso

Introducción a la calidad de datos con Great Expectations

Ver curso

Instrucciones del ejercicio

  • Pulsa Run Code para ver la salida del código.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create Data Context
context = gx.get_context()

# Create pandas Data Source, Data Asset, and Batch Definition
data_source = context.data_sources.add_pandas(
  name="my_pandas_datasource"
)
data_asset = data_source.add_dataframe_asset(
  name="my_data_asset"
)
batch_definition = data_asset.add_batch_definition_whole_dataframe(
  name="my_batch_definition"
)
batch = batch_definition.get_batch(
  batch_parameters={"dataframe": dataframe}
)

# Create Expectation Suite and Validation Definition
suite = context.suites.add(
  gx.ExpectationSuite(name="my_suite", suite_parameters={})
)
validation_definition = gx.ValidationDefinition(
  data=batch_definition, suite=suite, name="validation"
)

# Establish and evaluate an Expectation
expectation = gx.expectations.ExpectTableRowCountToBeBetween(
  min_value=50000, max_value=100000
)
validation_results = batch.validate(expect=expectation)
print(validation_results.success)
Editar y ejecutar código