BaşlayınÜcretsiz başlayın

Parquet dosyalarından veri çıkarma

Kaynak bir sistemden veri almak için en yaygın yöntemlerden biri, CSV gibi bir dosyadan okumaktır. Veriler büyüdükçe, daha iyi dosya formatlarına duyulan ihtiyaç, parquet gibi sütun odaklı yeni dosya türlerini ortaya çıkardı.

Bu egzersizde, bir parquet dosyasından veri çıkarmayı pratik edeceksin.

Bu egzersiz, kursun bir parçasıdır

Python ile ETL ve ELT

Kursa Göz Atın

Egzersiz talimatları

  • "sales_data.parquet" yolundaki parquet dosyasını bir pandas DataFrame'ine oku.
  • DataFrame'in veri türlerini print() ile kontrol et.
  • DataFrame'in şeklini ve ilk satırlarını (head) yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

import pandas as pd

# Read the sales data into a DataFrame
sales_data = pd.____("____", engine="fastparquet")

# Check the data type of the columns of the DataFrames
print(sales_data.____)

# Print the shape of the DataFrame, as well as the head
print(sales_data.____)
print(sales_data.____())
Kodu Düzenle ve Çalıştır