Definisikan variabel target
Di sini, Anda akan membangun tabel pivot pandas dengan pelanggan sebagai baris, bulan faktur sebagai kolom, dan jumlah faktur sebagai nilai. Anda akan menggunakan nilai bulan terakhir sebagai variabel target. Variabel lainnya dapat digunakan sebagai fitur terlambat (lagged features) dalam model. Anda tidak akan menggunakannya sekarang, tetapi sangat dianjurkan untuk memeriksa apakah penambahan variabel-variabel ini akan meningkatkan kinerja model Anda melampaui yang akan Anda lihat pada latihan berikutnya.
Pustaka pandas dan numpy telah dimuat masing-masing sebagai pd dan np. Himpunan data online telah diimpor untuk Anda.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Petunjuk latihan
- Bangun tabel pivot menggunakan fungsi
pivot_table()untuk menghitung faktur. - Simpan nama kolom data penjualan November 2011 sebagai sebuah daftar.
- Simpan nilai target sebagai
Y.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build a pivot table counting invoices for each customer monthly
cust_month_tx = pd.___(data=online, values='___',
index=['___'], columns=['___'],
aggfunc=pd.Series.nunique, fill_value=0)
# Store November 2011 data column name as a list
target = ['2011-___']
# Store target value as `Y`
Y = cust_month_tx[___]