Menjadwalkan DAG melalui Python
Anda telah mempelajari banyak hal tentang membuat DAG, tetapi sekarang Anda ingin menjadwalkan DAG tertentu pada hari tertentu dalam seminggu pada waktu tertentu. Anda ingin kode menyertakan informasi ini jika seorang rekan perlu memasang ulang DAG ke server yang berbeda.
Objek Airflow DAG dan metode datetime yang sesuai telah diimpor untuk Anda.
Latihan ini adalah bagian dari kursus
Pengantar Apache Airflow dengan Python
Petunjuk latihan
- Tetapkan tanggal mulai DAG ke 1 November 2023.
- Konfigurasikan
retry_delaymenjadi 20 menit. Anda akan mempelajari lebih lanjut tentang objek timedelta di Bab 3. Untuk saat ini, Anda hanya perlu mengetahui bahwa objek tersebut mengharapkan nilai bilangan bulat. - Gunakan sintaks cron untuk mengonfigurasi jadwal setiap hari Rabu pukul 12.30 siang.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Update the scheduling arguments as defined
default_args = {
'owner': 'Engineering',
'start_date': datetime(____, ____, ____),
'email': ['[email protected]'],
'email_on_failure': False,
'email_on_retry': False,
'retries': 3,
'retry_delay': timedelta(minutes=____)
}
dag = DAG('update_dataflows', default_args=default_args, schedule_interval='____')