ComeçarComece gratuitamente

Validação de um pipeline de dados com assert e isinstance

Para criar testes de unidade para pipelines de dados, é importante que você se familiarize com a palavra-chave assert e a função isinstance(). Neste exercício, você praticará o uso dessas duas ferramentas para validar os componentes de um pipeline de dados.

As funções extract() e transform() foram disponibilizadas para você, juntamente com pandas, que foi importada como pd. Tanto o extract() quanto o transform() retornam um DataFrame. Boa sorte!

Este exercício faz parte do curso

ETL e ELT em Python

Ver Curso

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)

# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____
Editar e executar código