MulaiMulai sekarang secara gratis

Definisikan variabel target

Di sini, Anda akan membangun tabel pivot pandas dengan pelanggan sebagai baris, bulan faktur sebagai kolom, dan jumlah faktur sebagai nilai. Anda akan menggunakan nilai bulan terakhir sebagai variabel target. Variabel lainnya dapat digunakan sebagai fitur terlambat (lagged features) dalam model. Anda tidak akan menggunakannya sekarang, tetapi sangat dianjurkan untuk memeriksa apakah penambahan variabel-variabel ini akan meningkatkan kinerja model Anda melampaui yang akan Anda lihat pada latihan berikutnya.

Pustaka pandas dan numpy telah dimuat masing-masing sebagai pd dan np. Himpunan data online telah diimpor untuk Anda.

Latihan ini adalah bagian dari kursus

Machine Learning untuk Pemasaran dengan Python

Lihat Kursus

Petunjuk latihan

  • Bangun tabel pivot menggunakan fungsi pivot_table() untuk menghitung faktur.
  • Simpan nama kolom data penjualan November 2011 sebagai sebuah daftar.
  • Simpan nilai target sebagai Y.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Build a pivot table counting invoices for each customer monthly
cust_month_tx = pd.___(data=online, values='___',
                               index=['___'], columns=['___'],
                               aggfunc=pd.Series.nunique, fill_value=0)

# Store November 2011 data column name as a list
target = ['2011-___']

# Store target value as `Y`
Y = cust_month_tx[___]
Edit dan Jalankan Kode