ComenzarEmpieza gratis

Pruebas unitarias de una canalización de datos con fixtures

En el último vídeo has aprendido que las pruebas unitarias pueden ayudar a infundir más confianza en tu canalización de datos, e incluso pueden ayudar a detectar errores a lo largo del desarrollo. En este ejercicio, practicarás escribiendo tanto fixtures como pruebas unitarias, utilizando la biblioteca pytest y assert.

A continuación se muestra, como referencia, la función transform en torno a la cual construirás pruebas unitarias. pandas se ha importado como pd, y la biblioteca pytest() está cargada y lista para su uso.

def transform(raw_data):

    raw_data["tax_rate"] = raw_data["total_taxes_paid"] / raw_data["total_taxable_income"]

    raw_data.set_index("industry_name", inplace=True)

    return raw_data

Este ejercicio forma parte del curso

Introducción a las canalizaciones de datos

Ver curso

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Define a pytest fixture
@pytest.fixture()
____ ____():
    raw_data = pd.read_csv("raw_tax_data.csv")
    
    # Transform the raw_data, store in clean_data DataFrame, and return the variable
    clean_data = ____
    return ____
Editar y ejecutar código