1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Python で学ぶ ETL と ELT

Connected

अभ्यास

データパイプラインのアーキテクチャパターン

データパイプラインを作成するときは、関数を定義するファイルと、それらを実行するファイルを分けるのがベストプラクティスです。

この演習では、パイプラインのコンポーネントを実行前にメモリへインポートし、その関数を使ってパイプラインをエンドツーエンドで動かす練習をします。プロジェクトは次の構成になっており、pipeline_utils にパイプライン実行で使用する extract()、transform()、load() 関数が保存されています。

> ls
 etl_pipeline.py
 pipeline_utils.py

निर्देश

100 XP
  • pipeline_utils モジュールから extract、transform、load 関数をインポートします。
  • インポートした関数を使って、データパイプラインをエンドツーエンドで実行します。