ComenzarEmpieza gratis

Validar una canalización de datos con assert

Para construir pruebas unitarias para canalizaciones de datos, es importante familiarizarse con la palabra clave assert, y con la función isinstance(). En este ejercicio, practicarás el uso de estas dos herramientas para validar los componentes de una canalización de datos.

Las funciones extract() y transform() se han puesto a tu disposición, junto con pandas, que se ha importado como pd. Tanto extract() como transform() devuelven un DataFrame. Buena suerte.

Este ejercicio forma parte del curso

ETL y ELT en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)

# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____
Editar y ejecutar código