Menganalisis kolom datetime
Rekayasa fitur merupakan langkah penting dalam semua alur kerja machine learning untuk memproses fitur dari berbagai tipe data. Secara khusus, kolom datetime umum dijumpai dalam banyak himpunan data. Pada latihan ini, Anda akan menelusuri kolom hour dalam himpunan data, yang disimpan sebagai integer tetapi merepresentasikan datetime. Pertama, Anda akan mengurai kolom hour untuk mengonversinya menjadi kolom datetime. Lalu Anda akan mengekstrak jam dalam sehari dari kolom datetime tersebut, dan menghitung total jumlah klik berdasarkan jam dalam sehari itu.
Modul pandas tersedia sebagai pd di workspace Anda dan DataFrame contoh telah dimuat sebagai df.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Konversikan kolom
hourdari integer menjadi kolomdatetimemenggunakanpd.to_datetime(). - Dengan aksesori datetime
.dt, ekstrak bidang jam dari kolom yang telah dikonversi menggunakan.hour. - Hitung total klik berdasarkan jam yang diekstrak menggunakan
.sum().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Change the hour column to a datetime and extract hour of day
df['hour'] = pd.____(df['hour'], format = '%y%m%d%H')
df['hour_of_day'] = df['hour'].____.____
print(df.head(5))
# Get and plot total clicks by hour of day
df.____('hour_of_day')['click'].____.plot.bar(figsize=(12,6))
plt.ylabel('Number of clicks')
plt.title('Number of clicks by hour of day')
plt.show()