Weitere PythonOperators
Um mit der Implementierung deines Workflows fortzufahren, musst du einen weiteren Schritt hinzufügen, um die heruntergeladene Datei zu parsen und die Änderungen zu speichern. Der DAG process_sales_dag ist definiert und die Aufgabe pull_file wurde bereits hinzugefügt. In diesem Fall ist die Python-Funktion bereits für dich definiert: parse_file(inputfile, outputfile).
Beachte, dass du beim Implementieren von Airflow-Aufgaben oft nicht jeden einzelnen Schritt bis ins Detail verstehst. Solange du weißt, wie du die Schritte in die Struktur von Airflow einbettest, kannst du den gewünschten Workflow umsetzen.
Diese Übung ist Teil des Kurses
Einführung in Apache Airflow mit Python
Anleitung zur Übung
- Definiere die Python-Aufgabe in der Variablen
parse_file_taskmit der IDparse_file. - Füge
parse_file(inputfile, outputfile)dem Operator hinzu. - Lege die Argumente fest, die an das callable übergeben werden sollen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Add another Python task
____ = ____(
task_id=____,
# Set the function to call
____
# Add the arguments
____={'inputfile':'latestsales.json', 'outputfile':'parsedfile.json'},
)