Aan de slagBegin gratis

Making a pipeline idempotent

A colleague's pipeline appends sales data on every run, so re-runs and backfills produce duplicates. Both the staging and sales tables have a date column (format YYYY-MM-DD).

Your team needs to make the pipeline idempotent: filter the staging query by the logical date, and add a preoperator to delete existing rows from the sales table.

Deze oefening maakt deel uit van de cursus

Building Data Pipelines with Airflow

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening