IniziaInizia gratis

Convalidare una data pipeline con assert

Per scrivere unit test per le data pipeline, è importante familiarizzare con la parola chiave assert e con la funzione isinstance(). In questo esercizio metterai in pratica questi due strumenti per convalidare i componenti di una data pipeline.

Le funzioni extract() e transform() sono già disponibili, insieme a pandas, importato come pd. Sia extract() sia transform() restituiscono un DataFrame. Buon lavoro!

Questo esercizio fa parte del corso

ETL and ELT in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)

# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____
Modifica ed esegui il codice