MulaiMulai sekarang secara gratis

Menganalisis kolom datetime

Rekayasa fitur merupakan langkah penting dalam semua alur kerja machine learning untuk memproses fitur dari berbagai tipe data. Secara khusus, kolom datetime umum dijumpai dalam banyak himpunan data. Pada latihan ini, Anda akan menelusuri kolom hour dalam himpunan data, yang disimpan sebagai integer tetapi merepresentasikan datetime. Pertama, Anda akan mengurai kolom hour untuk mengonversinya menjadi kolom datetime. Lalu Anda akan mengekstrak jam dalam sehari dari kolom datetime tersebut, dan menghitung total jumlah klik berdasarkan jam dalam sehari itu.

Modul pandas tersedia sebagai pd di workspace Anda dan DataFrame contoh telah dimuat sebagai df.

Latihan ini adalah bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Konversikan kolom hour dari integer menjadi kolom datetime menggunakan pd.to_datetime().
  • Dengan aksesori datetime .dt, ekstrak bidang jam dari kolom yang telah dikonversi menggunakan .hour.
  • Hitung total klik berdasarkan jam yang diekstrak menggunakan .sum().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Change the hour column to a datetime and extract hour of day
df['hour'] = pd.____(df['hour'], format = '%y%m%d%H')
df['hour_of_day'] = df['hour'].____.____
print(df.head(5))

# Get and plot total clicks by hour of day
df.____('hour_of_day')['click'].____.plot.bar(figsize=(12,6))
plt.ylabel('Number of clicks')
plt.title('Number of clicks by hour of day')
plt.show()
Edit dan Jalankan Kode