Melakukan agregasi
Setelah menyelesaikan beberapa pekerjaan konsultasi kecil untuk sebuah perpustakaan dan penjual ebook, akhirnya Anda menerima proyek analisis keranjang pasar besar pertama: memberi saran kepada peritel hadiah unik online tentang promosi silang. Karena peritel ini belum pernah mempekerjakan data scientist sebelumnya, mereka ingin Anda memulai proyek dengan menelusuri data transaksinya. Mereka meminta Anda melakukan agregasi untuk semua signs dalam himpunan data dan juga menghitung support untuk kategori ini. Perhatikan bahwa pandas telah diimpor sebagai pd. Selain itu, data telah diimpor dalam format one-hot encoded sebagai onehot.
Latihan ini adalah bagian dari kursus
Analisis Market Basket dengan Python
Petunjuk latihan
- Pilih subset kolom DataFrame yang mengandung string
sign. - Cetak nilai support untuk
signs.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Select the column headers for sign items
sign_headers = [i for i in onehot.columns if i.lower().find('sign')>=0]
# Select columns of sign items using sign_headers
sign_columns = onehot[____]
# Perform aggregation of sign items into sign category
signs = sign_columns.sum(axis = 1) >= 1.0
# Print support for signs
print('Share of Signs: %.2f' % ____.mean())