Mentransformasikan data penjualan dengan pandas
Sebelum wawasan dapat diekstraksi dari sebuah himpunan data, tipe kolom mungkin perlu diubah agar data dapat dimanfaatkan dengan tepat. Hal ini sangat umum untuk tipe data temporal, yang dapat disimpan dalam beberapa cara berbeda.
Untuk contoh ini, pandas telah diimpor sebagai pd dan siap Anda gunakan.
Latihan ini adalah bagian dari kursus
ETL dan ELT di Python
Petunjuk latihan
- Perbarui fungsi
transform()untuk mengonversi data pada kolom"Order Date"ke tipedatetime. - Saring DataFrame agar hanya berisi baris dengan
"Price Each"kurang dari sepuluh dolar. - Cetak tipe data untuk setiap kolom dalam DataFrame.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
raw_sales_data = extract("sales_data.csv")
def transform(raw_data):
# Convert the "Order Date" column to type datetime
raw_data["Order Date"] = pd.____(____, format="%m/%d/%y %H:%M")
# Only keep items under ten dollars
clean_data = raw_data.loc[____, :]
return clean_data
clean_sales_data = transform(raw_sales_data)
# Check the data types of each column
print(____)