1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 Python 的 ETL 和 ELT

Connected

道练习

从 parquet 文件抽取数据

从源系统摄取数据的常见方式之一是读取文件,例如 CSV 文件。随着数据规模变大,对更优文件格式的需求催生了新的面向列的文件类型,如 parquet 文件。

在本练习中,您将练习从 parquet 文件中抽取数据。

说明

100 XP
  • 将路径为 "sales_data.parquet" 的 parquet 文件读入一个 pandas DataFrame。
  • 使用 print() 检查该 DataFrame 的数据类型。
  • 输出该 DataFrame 的形状以及其前几行。