MulaiMulai sekarang secara gratis

Mengekstrak data dari file parquet

Salah satu cara paling umum untuk mengimpor data dari sistem sumber adalah dengan membaca data dari file, seperti file CSV. Seiring ukuran data yang semakin besar, kebutuhan akan format file yang lebih baik menghadirkan tipe file berorientasi kolom yang baru, seperti file parquet.

Dalam latihan ini, Anda akan berlatih mengekstrak data dari sebuah file parquet.

Latihan ini adalah bagian dari kursus

ETL dan ELT di Python

Lihat Kursus

Petunjuk latihan

  • Baca file parquet pada path "sales_data.parquet" ke dalam sebuah DataFrame pandas.
  • Periksa tipe data DataFrame dengan melakukan print().
  • Tampilkan dimensi DataFrame, serta head-nya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

import pandas as pd

# Read the sales data into a DataFrame
sales_data = pd.____("____", engine="fastparquet")

# Check the data type of the columns of the DataFrames
print(sales_data.____)

# Print the shape of the DataFrame, as well as the head
print(sales_data.____)
print(sales_data.____())
Edit dan Jalankan Kode