MulaiMulai sekarang secara gratis

Mentransformasikan data penjualan dengan pandas

Sebelum wawasan dapat diekstraksi dari sebuah himpunan data, tipe kolom mungkin perlu diubah agar data dapat dimanfaatkan dengan tepat. Hal ini sangat umum untuk tipe data temporal, yang dapat disimpan dalam beberapa cara berbeda.

Untuk contoh ini, pandas telah diimpor sebagai pd dan siap Anda gunakan.

Latihan ini adalah bagian dari kursus

ETL dan ELT di Python

Lihat Kursus

Petunjuk latihan

  • Perbarui fungsi transform() untuk mengonversi data pada kolom "Order Date" ke tipe datetime.
  • Saring DataFrame agar hanya berisi baris dengan "Price Each" kurang dari sepuluh dolar.
  • Cetak tipe data untuk setiap kolom dalam DataFrame.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

raw_sales_data = extract("sales_data.csv")

def transform(raw_data):
    # Convert the "Order Date" column to type datetime
    raw_data["Order Date"] = pd.____(____, format="%m/%d/%y %H:%M")
    
    # Only keep items under ten dollars
    clean_data = raw_data.loc[____, :]
    return clean_data

clean_sales_data = transform(raw_sales_data)

# Check the data types of each column
print(____)
Edit dan Jalankan Kode