LoslegenKostenlos starten

Unit-Tests einer Datenpipeline mit Fixtures

Im letzten Video hast du gelernt, dass Unit-Tests dazu beitragen können, mehr Vertrauen in deine Datenpipeline zu schaffen, und dass sie sogar helfen können, Fehler während der Entwicklung zu finden. In dieser Übung übst du das Schreiben von Fixtures und Unit-Tests unter Verwendung der Bibliothek pytest und assert.

Die Funktion transform, mit der du Unit-Tests erstellen wirst, ist unten abgebildet. pandas wurde als pd importiert, und die Bibliothek pytest() ist geladen und einsatzbereit.

def transform(raw_data):

    raw_data["tax_rate"] = raw_data["total_taxes_paid"] / raw_data["total_taxable_income"]

    raw_data.set_index("industry_name", inplace=True)

    return raw_data

Diese Übung ist Teil des Kurses

<Kurs>ETL und ELT mit Python</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Define a pytest fixture
@pytest.fixture()
____ ____():
    raw_data = pd.read_csv("raw_tax_data.csv")
    
    # Transform the raw_data, store in clean_data DataFrame, and return the variable
    clean_data = ____
    return ____
Code bearbeiten und ausführen