BaşlayınÜcretsiz Başlayın

Parquet dosyalarından veri çıkarma

Kaynak bir sistemden veri almak için en yaygın yöntemlerden biri, CSV gibi bir dosyadan okumaktır. Veriler büyüdükçe, daha iyi dosya formatlarına duyulan ihtiyaç, parquet gibi sütun odaklı yeni dosya türlerini ortaya çıkardı.

Bu egzersizde, bir parquet dosyasından veri çıkarmayı pratik edeceksin.

Bu egzersiz

Python ile ETL ve ELT

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • "sales_data.parquet" yolundaki parquet dosyasını bir pandas DataFrame'ine oku.
  • DataFrame'in veri türlerini print() ile kontrol et.
  • DataFrame'in şeklini ve ilk satırlarını (head) yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

import pandas as pd

# Read the sales data into a DataFrame
sales_data = pd.____("____", engine="fastparquet")

# Check the data type of the columns of the DataFrames
print(sales_data.____)

# Print the shape of the DataFrame, as well as the head
print(sales_data.____)
print(sales_data.____())
Kodu Düzenle ve Çalıştır