Convalidare una data pipeline con assert
Per scrivere unit test per le data pipeline, è importante familiarizzare con la parola chiave assert e con la funzione isinstance(). In questo esercizio metterai in pratica questi due strumenti per convalidare i componenti di una data pipeline.
Le funzioni extract() e transform() sono già disponibili, insieme a pandas, importato come pd. Sia extract() sia transform() restituiscono un DataFrame. Buon lavoro!
Questo esercizio fa parte del corso
ETL and ELT in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)
# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____