Pruebas unitarias de una canalización de datos con fixtures
En el último vídeo has visto que las pruebas unitarias ayudan a generar más confianza en tu canalización de datos y pueden incluso detectar errores durante el desarrollo. En este ejercicio, practicarás cómo escribir tanto fixtures como pruebas unitarias usando la biblioteca pytest y assert.
A modo de referencia, a continuación tienes la función transform sobre la que vas a crear pruebas unitarias. pandas se ha importado como pd, y la biblioteca pytest() está cargada y lista para usar.
def transform(raw_data):
raw_data["tax_rate"] = raw_data["total_taxes_paid"] / raw_data["total_taxable_income"]
raw_data.set_index("industry_name", inplace=True)
return raw_data
Este ejercicio forma parte del curso
ETL and ELT con Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Define a pytest fixture
@pytest.fixture()
____ ____():
raw_data = pd.read_csv("raw_tax_data.csv")
# Transform the raw_data, store in clean_data DataFrame, and return the variable
clean_data = ____
return ____