Fitur tanggal
Anda telah membangun beberapa fitur dasar menggunakan variabel numerik. Sekarang, saatnya membuat fitur berbasis tanggal dan waktu. Anda akan berlatih pada sampel kecil dari data kompetisi Kaggle Taxi Fare Prediction. Data ini berisi informasi tentang perjalanan taksi dan tujuannya adalah memprediksi harga untuk tiap perjalanan.
Tujuan Anda adalah menghasilkan fitur tanggal dari pickup datetime. Ingat bahwa lebih baik membuat fitur baru untuk data train dan test secara bersamaan. Setelah fitur dibuat, pisahkan kembali data menjadi DataFrame train dan test. Di sini hal tersebut dilakukan menggunakan metode isin() dari pandas.
DataFrame train dan test sudah tersedia di workspace Anda.
Latihan ini adalah bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Petunjuk latihan
- Gabungkan DataFrame
traindantestmenjadi satu DataFrametaxi. - Konversikan kolom "pickup_datetime" menjadi objek
datetime. - Buat fitur hari dalam sepekan (menggunakan atribut
.dayofweek) dan jam (menggunakan atribut.hour) dari kolom "pickup_datetime".
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Concatenate train and test together
taxi = ____.____([train, test])
# Convert pickup date to datetime object
taxi['pickup_datetime'] = ____.____(taxi['pickup_datetime'])
# Create a day of week feature
taxi['dayofweek'] = taxi['pickup_datetime'].dt.____
# Create an hour feature
taxi['hour'] = taxi['pickup_datetime'].dt.____
# Split back into train and test
new_train = taxi[taxi['id'].isin(train['id'])]
new_test = taxi[taxi['id'].isin(test['id'])]