Parquet dosyalarından veri çıkarma
Kaynak bir sistemden veri almak için en yaygın yöntemlerden biri, CSV gibi bir dosyadan okumaktır. Veriler büyüdükçe, daha iyi dosya formatlarına duyulan ihtiyaç, parquet gibi sütun odaklı yeni dosya türlerini ortaya çıkardı.
Bu egzersizde, bir parquet dosyasından veri çıkarmayı pratik edeceksin.
Bu egzersiz, kursun bir parçasıdır
Python ile ETL ve ELT
Egzersiz talimatları
"sales_data.parquet"yolundaki parquet dosyasını birpandasDataFrame'ine oku.- DataFrame'in veri türlerini
print()ile kontrol et. - DataFrame'in şeklini ve ilk satırlarını (head) yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
import pandas as pd
# Read the sales data into a DataFrame
sales_data = pd.____("____", engine="fastparquet")
# Check the data type of the columns of the DataFrames
print(sales_data.____)
# Print the shape of the DataFrame, as well as the head
print(sales_data.____)
print(sales_data.____())