Validando um pipeline de dados com assert
Para criar testes de unidade para pipelines de dados, é importante se familiarizar com a palavra-chave assert e com a função isinstance(). Neste exercício, você vai praticar o uso dessas duas ferramentas para validar componentes de um pipeline de dados.
As funções extract() e transform() já estão disponíveis para você, assim como o pandas, importado como pd. Tanto extract() quanto transform() retornam um DataFrame. Boa sorte!
Este exercício faz parte do curso
ETL and ELT em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)
# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____