Validación de una canalización de datos con assert
Para crear pruebas unitarias de canalizaciones de datos, es importante familiarizarse con la palabra clave assert y con la función isinstance(). En este ejercicio, practicarás el uso de estas dos herramientas para validar componentes de una canalización de datos.
Las funciones extract() y transform() están disponibles para ti, junto con pandas, que se ha importado como pd. Tanto extract() como transform() devuelven un DataFrame. ¡Suerte!
Este ejercicio forma parte del curso
ETL and ELT con Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)
# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____