ComeçarComece de graça

Validando um pipeline de dados com assert

Para criar testes de unidade para pipelines de dados, é importante se familiarizar com a palavra-chave assert e com a função isinstance(). Neste exercício, você vai praticar o uso dessas duas ferramentas para validar componentes de um pipeline de dados.

As funções extract() e transform() já estão disponíveis para você, assim como o pandas, importado como pd. Tanto extract() quanto transform() retornam um DataFrame. Boa sorte!

Este exercício faz parte do curso

ETL and ELT em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)

# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____
Editar e executar o código