Altri PythonOperator
Per continuare a implementare il tuo workflow, devi aggiungere un altro passaggio per analizzare e salvare le modifiche del file scaricato. Il DAG process_sales_dag è già definito e include il task pull_file. In questo caso, la funzione Python è già definita per te: parse_file(inputfile, outputfile).
Tieni presente che, quando implementi i task in Airflow, spesso potresti non conoscere nel dettaglio i singoli passaggi che ti vengono forniti. Finché capisci come incapsularli nella struttura di Airflow, sarai in grado di implementare il workflow desiderato.
Questo esercizio fa parte del corso
Introduzione ad Apache Airflow in Python
Istruzioni dell'esercizio
- Definisci il task Python nella variabile
parse_file_taskcon l’idparse_file. - Aggiungi
parse_file(inputfile, outputfile)all’Operator. - Definisci gli argomenti da passare al callable.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Add another Python task
____ = ____(
task_id=____,
# Set the function to call
____
# Add the arguments
____={'inputfile':'latestsales.json', 'outputfile':'parsedfile.json'},
)