1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ ETL と ELT

Connected

演習

ETL パイプラインを実行する

最初の ETL パイプラインを実行してみましょう。さっそく始めます!

ここでは、extract()、transform()、load() の各関数が用意されています。データの ETL パイプラインを動かすには、これらの関数を順番に実行します。気になる方は、extract() 関数の中身を少し覗いてみてください。

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

指示

100 XP
  • extract() 関数を使って、raw_data.csv ファイルからデータを抽出します。
  • transform() 関数を使って、extracted_data DataFrame を変換します。
  • 最後に、transformed_data DataFrame を cleaned_data の SQL テーブルにロードします。