Définir l’ordre des BashOperator
Maintenant que vous avez découvert les opérateurs de décalage de bits, il est temps de modifier votre workflow pour inclure une étape de récupération et définir l’ordre des tâches. Vous avez actuellement trois composants définis : cleanup, consolidate et push_data.
Le DAG analytics_dag est disponible comme précédemment et le BashOperator est déjà importé.
Cet exercice fait partie du cours
Introduction à Apache Airflow en Python
Instructions
- Définissez un
BashOperatorappelépull_salesavec la commande bashwget https://salestracking/latestinfo?json. - Paramétrez l’opérateur
pull_salespour qu’il s’exécute avant la tâchecleanup. - Configurez
consolidatepour s’exécuter ensuite, en utilisant l’opérateur d’aval (downstream). - Faites en sorte que
push_datas’exécute en dernier en utilisant l’un ou l’autre opérateur de décalage de bits.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define a new pull_sales task
pull_sales = ____(
task_id='pullsales_task',
____
)
# Set pull_sales to run prior to cleanup
pull_sales ____ cleanup
# Configure consolidate to run after cleanup
____
# Set push_data to run last
consolidate ____