1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ ETL と ELT

Connected

演習

parquet ファイルからのデータ抽出

ソースシステムからデータを取り込む一般的な方法のひとつは、CSV のようなファイルから読み込むことです。データが大規模化するにつれて、より優れたファイル形式が求められ、parquet のような列指向の新しいファイルタイプが登場しました。

この演習では、parquet ファイルからデータを抽出する練習をします。

指示

100 XP
  • パス "sales_data.parquet" の parquet ファイルを pandas の DataFrame に読み込みます。
  • print() を使って DataFrame のデータ型を確認します。
  • DataFrame の形状と先頭行を出力します。