pandas ile satış verilerini dönüştürme
Bir veri kümesinden içgörü elde etmeden önce, verileri doğru şekilde kullanabilmek için sütun türlerini değiştirmek gerekebilir. Bu durum özellikle, birden fazla biçimde saklanabilen zamansal veri türleri için yaygındır.
Bu örnek için, pandas pd olarak içe aktarılmış durumda ve kullanman için hazır.
Bu egzersiz, kursun bir parçasıdır
Python ile ETL ve ELT
Egzersiz talimatları
transform()fonksiyonunu güncelleyerek"Order Date"sütunundaki verileridatetimetipine dönüştür.- DataFrame’i yalnızca
"Price Each"değeri on dolardan küçük olan satırları içerecek şekilde filtrele. - DataFrame’deki her sütunun veri tiplerini yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
raw_sales_data = extract("sales_data.csv")
def transform(raw_data):
# Convert the "Order Date" column to type datetime
raw_data["Order Date"] = pd.____(____, format="%m/%d/%y %H:%M")
# Only keep items under ten dollars
clean_data = raw_data.loc[____, :]
return clean_data
clean_sales_data = transform(raw_sales_data)
# Check the data types of each column
print(____)