Melakukan agregasi
Setelah menyelesaikan beberapa pekerjaan konsultasi kecil untuk sebuah perpustakaan dan penjual ebook, akhirnya Anda menerima proyek analisis keranjang pasar besar pertama: memberi saran kepada peritel hadiah unik online tentang promosi silang. Karena peritel ini belum pernah mempekerjakan data scientist sebelumnya, mereka ingin Anda memulai proyek dengan menelusuri data transaksinya. Mereka meminta Anda melakukan agregasi untuk semua signs dalam himpunan data dan juga menghitung support untuk kategori ini. Perhatikan bahwa pandas telah diimpor sebagai pd. Selain itu, data telah diimpor dalam format one-hot encoded sebagai onehot.
Latihan ini merupakan bagian dari kursus
Analisis Market Basket dengan Python
Instruksi latihan
- Pilih subset kolom DataFrame yang mengandung string
sign. - Cetak nilai support untuk
signs.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Select the column headers for sign items
sign_headers = [i for i in onehot.columns if i.lower().find('sign')>=0]
# Select columns of sign items using sign_headers
sign_columns = onehot[____]
# Perform aggregation of sign items into sign category
signs = sign_columns.sum(axis = 1) >= 1.0
# Print support for signs
print('Share of Signs: %.2f' % ____.mean())