Validar una canalización de datos con assert
Para construir pruebas unitarias para canalizaciones de datos, es importante familiarizarse con la palabra clave assert
, y con la función isinstance()
. En este ejercicio, practicarás el uso de estas dos herramientas para validar los componentes de una canalización de datos.
Las funciones extract()
y transform()
se han puesto a tu disposición, junto con pandas
, que se ha importado como pd
. Tanto extract()
como transform()
devuelven un DataFrame. Buena suerte.
Este ejercicio forma parte del curso
ETL y ELT en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)
# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____