1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ ETL と ELT

Connected

演習

売上データを CSV ファイルにロードする

データのロードは、あらゆるデータパイプラインの重要な要素です。これにより、パイプラインの前段で抽出・変換したデータに、データ利用者や後続プロセスが確実にアクセスできるようになります。この演習では、pandas(pd としてインポート済み)を使って、変換後の売上データを CSV ファイルにロードする練習をします。あわせて、生データはすでに抽出されており、DataFrame raw_sales_data として利用可能です。

指示

100 XP
  • raw_sales_data DataFrame を、価格が25ドル未満の項目だけが残るようにフィルタリングします。
  • load() 関数を更新し、変換後の売上データを "transformed_sales_data.csv" という名前のファイルに書き出し、index 列を含めないようにします。
  • クリーニング済みの DataFrame に対して load() 関数を呼び出します。