Inizia subitoInizia gratis

Convalidare una data pipeline con assert

Per scrivere unit test per le data pipeline, è importante familiarizzare con la parola chiave assert e con la funzione isinstance(). In questo esercizio metterai in pratica questi due strumenti per convalidare i componenti di una data pipeline.

Le funzioni extract() e transform() sono già disponibili, insieme a pandas, importato come pd. Sia extract() sia transform() restituiscono un DataFrame. Buon lavoro!

Questo esercizio fa parte del corso

ETL and ELT in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

raw_tax_data = extract("raw_tax_data.csv")
clean_tax_data = transform(raw_tax_data)

# Validate the number of columns in the DataFrame
____ len(clean_tax_data.columns) == ____
Modifica ed esegui il codice