Validação de um pipeline de dados com assert e isinstance
Para criar testes de unidade para pipelines de dados, é importante que você se familiarize com a palavra-chave assert
e a função isinstance()
. Neste exercício, você praticará o uso dessas duas ferramentas para validar os componentes de um pipeline de dados.
As funções extract()
e transform()
foram disponibilizadas para você, juntamente com pandas
, que foi importada como pd
. Tanto o extract()
quanto o transform()
retornam um DataFrame. Boa sorte!
Este exercício faz parte do curso
ETL e ELT em Python
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)
# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____