Validación de una canalización de datos con assert
Para crear pruebas unitarias de canalizaciones de datos, es importante familiarizarse con la palabra clave assert y con la función isinstance(). En este ejercicio, practicarás el uso de estas dos herramientas para validar componentes de una canalización de datos.
Las funciones extract() y transform() están disponibles para ti, junto con pandas, que se ha importado como pd. Tanto extract() como transform() devuelven un DataFrame. ¡Suerte!
Este ejercicio forma parte del curso
ETL y ELT en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)
# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____