1. Lära sig
  2. /
  3. Courses
  4. /
  5. 데이터 엔지니어링 입문

Connected

exercise

DAG 정의하기

이전 연습 문제에서 ETL 프로세스의 세 단계에 대해 실습해 보셨죠:

  • Extract: PostgreSQL의 film 테이블을 pandas로 추출합니다.
  • Transform: film DataFrame의 rental_rate 열을 분리합니다.
  • Load: film DataFrame을 PostgreSQL 데이터 웨어하우스에 적재합니다.

extract_film_to_pandas(), transform_rental_rate(), load_dataframe_to_film() 함수는 워크스페이스에 정의되어 있어요. 이번 연습에서는 기존 DAG에 ETL 작업을 추가하겠습니다. 확장할 DAG와 대기해야 하는 작업은 각각 dag와 wait_for_table로 워크스페이스에 정의되어 있어요.

Instruktioner

100 XP
  • 연습 설명에 나온 함수들을 사용해 etl() 함수를 완성하세요.
  • etl_task가 etl 호출 가능 객체를 사용하도록 하세요.
  • 올바른 상위(Upstream) 의존성을 설정하세요. etl_task는 wait_for_table이 완료될 때까지 기다려야 합니다.
  • 샘플 코드는 예시 실행을 포함합니다. 즉, 코드를 실행하면 ETL 파이프라인이 함께 실행됩니다.