Implicaciones para el albacea
Estás aprendiendo bastante sobre el funcionamiento de Airflow DAGs y estás adquiriendo cierta confianza en el desarrollo de nuevos flujos de trabajo. Dicho esto, tu jefe ha mencionado que algunos días los flujos de trabajo tardan mucho más en terminar y te pide que lo investigues. También menciona que el archivo salesdata_ready.csv
tarda más en generarse estos días y que la hora del día en que se completa es variable.
Este ejercicio requiere información de las dos lecciones anteriores: recuerda las implicaciones de los argumentos disponibles y modifica el flujo de trabajo en consecuencia. Ten en cuenta que para este ejercicio se espera que modifiques una línea de código, no que añadas código adicional.
Este ejercicio forma parte del curso
Introducción a Apache Airflow en Python
Instrucciones de ejercicio
- Determina el nivel de paralelismo disponible en este sistema. Puedes hacerlo comprobando la configuración del flujo de aire (puedes ejecutar
airflow info
en el terminal). - Mira la fuente del archivo DAG y arregla qué entrada está causando el problema.
Ejercicio interactivo práctico
Convierte la teoría en acción con uno de nuestros ejercicios interactivos
