Volgorde van BashOperators definiëren
Nu je de bitshift-operators kent, is het tijd om je workflow aan te passen zodat er een pull-stap in zit en de volgorde van de taken is vastgelegd. Je hebt drie al gedefinieerde componenten: cleanup, consolidate en push_data.
De DAG analytics_dag is zoals eerder beschikbaar en de BashOperator is al geïmporteerd.
Deze oefening maakt deel uit van de cursus
Introductie tot Apache Airflow in Python
Oefeninstructies
- Definieer een
BashOperatormet de naampull_salesmet als bash-commandowget https://salestracking/latestinfo?json. - Laat de operator
pull_salesdraaien vóór de taakcleanup. - Stel
consolidatezo in dat die daarna draait, met de downstream-operator. - Laat
push_dataals laatste draaien met een van beide bitshift-operators.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Define a new pull_sales task
pull_sales = ____(
task_id='pullsales_task',
____
)
# Set pull_sales to run prior to cleanup
pull_sales ____ cleanup
# Configure consolidate to run after cleanup
____
# Set push_data to run last
consolidate ____