ComeçarComece de graça

Validando um pipeline de dados com assert

Para criar testes de unidade para pipelines de dados, é importante se familiarizar com a palavra-chave assert e com a função isinstance(). Neste exercício, você vai praticar o uso dessas duas ferramentas para validar componentes de um pipeline de dados.

As funções extract() e transform() já estão disponíveis para você, assim como o pandas, importado como pd. Tanto extract() quanto transform() retornam um DataFrame. Boa sorte!

Este exercício faz parte do curso

ETL e ELT em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)

# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____
Editar e executar o código