1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ Apache Airflow 入門

Connected

演習

さらにPythonOperatorを使う

ワークフローの実装を続けるために、ダウンロードしたファイルをパースして変更内容を保存するステップをもう一つ追加する必要があります。DAG process_sales_dag は定義済みで、pull_file タスクはすでに追加されています。今回のケースでは、Python関数 parse_file(inputfile, outputfile) もすでに用意されています。

Airflowのタスクを実装する際は、与えられた個々のステップの意味を必ずしもすべて理解していない場合があります。Airflowの構造の中にステップを正しく組み込む方法さえ分かっていれば、望むワークフローを実装できます。

指示

100 XP
  • 変数 parse_file_task に、id が parse_file のPythonタスクを定義します。
  • Operator に parse_file(inputfile, outputfile) を追加します。
  • callable に渡す引数を定義します。