Parquet dosyalarından veri çıkarma
Kaynak bir sistemden veri almak için en yaygın yöntemlerden biri, CSV gibi bir dosyadan okumaktır. Veriler büyüdükçe, daha iyi dosya formatlarına duyulan ihtiyaç, parquet gibi sütun odaklı yeni dosya türlerini ortaya çıkardı.
Bu egzersizde, bir parquet dosyasından veri çıkarmayı pratik edeceksin.
Bu egzersiz
Python ile ETL ve ELT
kursunun bir parçasıdırEgzersiz talimatları
"sales_data.parquet"yolundaki parquet dosyasını birpandasDataFrame'ine oku.- DataFrame'in veri türlerini
print()ile kontrol et. - DataFrame'in şeklini ve ilk satırlarını (head) yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
import pandas as pd
# Read the sales data into a DataFrame
sales_data = pd.____("____", engine="fastparquet")
# Check the data type of the columns of the DataFrames
print(sales_data.____)
# Print the shape of the DataFrame, as well as the head
print(sales_data.____)
print(sales_data.____())