Mehr PythonOperatoren
Um deinen Workflow weiter zu implementieren, musst du einen weiteren Schritt hinzufügen, um die Änderungen der heruntergeladenen Datei zu analysieren und zu speichern. Die DAG process_sales_dag
ist definiert und hat die Aufgabe pull_file
bereits hinzugefügt. In diesem Fall ist die Python-Funktion bereits für dich definiert, parse_file(inputfile, outputfile)
.
Beachte, dass du bei der Umsetzung von Airflow-Aufgaben oft nicht unbedingt die einzelnen Schritte verstehst, die dir vorgegeben werden. Solange du verstehst, wie du die Schritte in die Airflow-Struktur einbindest, kannst du den gewünschten Arbeitsablauf umsetzen.
Diese Übung ist Teil des Kurses
Einführung in Apache Airflow in Python
Anleitung zur Übung
- Definiere den Python-Task in der Variable
parse_file_task
mit der idparse_file
. - Füge die
parse_file(inputfile, outputfile)
zum Operator hinzu. - Definiere die Argumente, die an den Callable übergeben werden sollen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Add another Python task
____ = ____(
task_id=____,
# Set the function to call
____
# Add the arguments
____={'inputfile':'latestsales.json', 'outputfile':'parsedfile.json'},
)