Validando um pipeline de dados com assert
Para criar testes de unidade para pipelines de dados, é importante se familiarizar com a palavra-chave assert e com a função isinstance(). Neste exercício, você vai praticar o uso dessas duas ferramentas para validar componentes de um pipeline de dados.
As funções extract() e transform() já estão disponíveis para você, assim como o pandas, importado como pd. Tanto extract() quanto transform() retornam um DataFrame. Boa sorte!
Este exercício faz parte do curso
ETL e ELT em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)
# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____