Langkah awal
Dalam latihan ini, Anda akan meninjau data contoh secara cepat menggunakan beberapa operasi dasar DataFrame dan melihat sekilas CTR. Data berasal dari Avazu, sebuah platform periklanan global terkemuka, dan merekam interaksi pengguna pada berbagai jenis perangkat untuk beragam situs web dan aplikasi.
Variabel target berada pada kolom click. Kolom jam menggunakan format YYMMDDHH, dan ada beberapa kolom bertipe integer: device_type untuk jenis perangkat, banner_pos untuk posisi iklan banner (juga dikenal sebagai display ad), dan lain-lain. Akan ada variabel lain yang dibahas pada bab-bab selanjutnya.
Data contoh dalam bentuk DataFrame dimuat sebagai df. pandas sebagai pd tersedia di ruang kerja Anda.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Definisikan variabel
Xmenggunakan.isin().Xakan mencakup semua kolom kecuali kolomclick. - Definisikan variabel
y, yang dapat diakses menggunakandf.click. - Cetak proporsi baris
yyang bernilai1—ini merepresentasikan CTR sampel, menggunakany.sum().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Look at basics of Dataframe
print(df.head(5))
print(df.columns)
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____
# Sample CTR
print("Sample CTR :\n",
y.____/len(y))